一种基于听觉调制机制和对比学习的单通道语音分离方法及装置

导航：龙图腾网> 最新专利技术> 一种基于听觉调制机制和对比学习的单通道语音分离方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开一种基于听觉调制机制和对比学习的单通道语音分离方法，方法包括：1使用麦克风采集若干说话人的语音原始数据，随机选取多个不同说话人的语音信号在不同信噪比下混合构建语音数据集，并划分为训练集、验证集和测试集；2采用包络检波计算调制幅度谱和相位谱；3基于突变点检测和匹配方法在调制幅度谱上生成语音片段；4随机选取语音片段构建三元组；5基于正负样本欧氏距离在线筛选硬半硬三元组作为训练样本；6建立三重注意力对比学习网络模型，提取三元组中语音片段特征；7设计相似度损失函数，使用训练集更新三重注意力对比学习网络参数，并利用验证集选取网络最优超参数；8建立自适应神经结构演进网络以无监督的方式实现语音片段特征聚类；9基于聚类结果计算二值掩蔽，对不同说话人的语音重构获得分离后的语音；10将测试集中的混合语音信号输入训练好的模型得到分离后的语音。该方法结合听觉调制机制和对比学习方法，能够以语音信号作为输入实现在非接触状态下对说话人混合语音的精确分离。

主权项：1.一种基于听觉调制机制和对比学习的单通道语音分离方法，其特征在于，包括以下步骤：步骤A、使用麦克风采集若干说话人的语音原始数据，随机选取多个不同说话人的语音信号混合构建语音数据集，并划分为训练集、验证集和测试集；步骤B、采用包络检波计算调制幅度谱和相位谱；步骤C、基于突变点检测和匹配方法在调制幅度谱上生成语音片段；步骤C1、使用突变点检测方法获得调制幅度谱的极大值点极小值点连线；步骤C2、利用突变点匹配方法生成语音片段；步骤D、随机选取语音片段构建三元组；步骤E、基于正负样本欧式距离在线筛选硬半硬三元组作为训练样本；步骤F、构建三重注意力对比学习网络提取语音片段特征；步骤F1、设计三重注意力机制，利用通道注意力区分不同通道的重要性，使用空间注意力聚合通道内的空间依赖性，通过多头自注意力捕获BLSTM层输出的长距离依赖关系；步骤F2、使用空间金字塔池化方法，统一不同大小语音片段的特征维度；步骤F3、设计相似度损失函数，缩小相同说话人语音片段特征之间的距离；步骤G、使用步骤E所述的训练样本更新三重注意力对比学习网络参数，通过验证集选择最优的超参数；步骤H、设计自适应神经结构演进网络对语音片段进行无监督自适应分类；步骤I、基于语音片段分类结果计算二值掩蔽，对不同说话人的语音片段语音重构，获得分离后的语音；步骤J、对于测试集中的待分离的混合语音，输入训练好的模型，得到分离后的语音。

全文数据：

权利要求：

百度查询：青岛科技大学一种基于听觉调制机制和对比学习的单通道语音分离方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种玻璃钢罐生产支撑限位装置

下一篇：一种隐形眼镜PP杯

相关技术

一种玻璃钢罐生产支撑限位装置

一种隐形眼镜PP杯

一种眼科手术用超声乳化设备

北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

一种舞台道具快速更换装置

可移动设备、刹车装置、驱动组件及锁止机构

一种检查平屋面找坡层坡度测量装置

一种建筑造价测绘装置

一种磁保持继电器的安装限定结构

一种复合垫片的双密封面加工设备及加工工艺

一种降解包装材料的流延加工设备

车盖后视装置、行人预警装置、行人预警方法及相关装置

单相关技术

蓄电单电池_丰田自动车株式会社_202410621535.4

单电池加工治具_上海律致氢能科技有限公司_202420564146.8

一种单级单吸卧式中开泵_上海连成集团苏州股份有限公司_202010709215.6

单井标产计量装置_胜利油田现河工贸有限责任公司_202420236450.X

单关节力控实验平台_北京航空航天大学_202420662943.X

工单处理方法及装置_中国建设银行股份有限公司_202111399385.X

单绞机的张力调节机构_广东日鸿电缆有限公司_202420438976.6

工程改造盐单胞菌_北京微构工场生物技术有限公司_202411318626.7

一种单电机浴霸_浙江优选电器有限公司_202323501575.5

一种手术铺单_首都医科大学附属北京安贞医院_202322320166.9

通道相关技术

铂金通道用线夹_湖南邵虹特种玻璃股份有限公司_202420754547.X

多排微通道换热器_浙江同星科技股份有限公司_202420666042.8

双通道输醇泵_无锡达希科技有限公司_202411471334.7

一种多通道式鱼道_昆明理工大学_202411449414.2

管道机器人巡检通道结构_上海申科建设工程质量检测有限公司_202420831766.3

闸机通道行人检测系统_精伦电子股份有限公司_202420585123.5

一种多通道逻辑阀门_山东仕博化工设备有限公司_202420847188.2

一种人行通道门_北京永乐颐康文化产业发展有限公司_202323496143.X

确定通道特性的系统及方法_美光科技公司_202410614493.1

气流床迷宫通道布风系统_青岛达能环保设备股份有限公司_202110284832.0

语音相关技术

训练文本转语音模型、文本转语音的方法、装置及设备_支付宝(杭州)信息技术有限公司_202410801337.6

一种将IOT设备与多品牌语音助手实现语音控制的方法_广州云智易物联网有限公司_202310568734.9

基于智能语音的加油监测装置_中国石油天然气股份有限公司_202323368855.3

语音情绪识别方法和装置_镁佳(北京)科技有限公司_202411113970.2

语音导览方法及系统_云南腾云信息产业有限公司_202411108561.3

一种适用于车内语音识别系统的语音端点检测方法及模块_清华大学苏州汽车研究院(相城)_202110677109.9

语音驱动唇形生成方法、装置及存储介质_武汉人工智能研究院_202310856520.1

语音实时翻译方法、系统与可视化终端_语联网(武汉)信息技术有限公司_202210420352.7

目标说话人语音提取方法和装置_腾讯科技(深圳)有限公司_202311626816.0

语音记录方法、装置、设备、存储介质及程序产品_维沃移动通信有限公司_202410968926.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于听觉调制机制和对比学习的单通道语音分离方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务