一种融合GMM和ResNext的说话人确认方法

导航：龙图腾网> 最新专利技术> 一种融合GMM和ResNext的说话人确认方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江西师范大学

摘要：本发明公开了一种融合GMM和ResNext的说话人确认方法，包括如下步骤：采用高斯混合模型以及多尺度ResNext模型组合成多尺度GMM‑ResNext模型，将多尺度GMM‑ResNext模型用于对实时的两条语音数据进行说话人确认；其中，多尺度ResNext模型是通过高斯混合模型提取的原始语音数据的对数高斯概率特征进行训练得到，高斯混合模型通过原始语音数据提取梅尔频率倒谱系数特征进行训练得到；本发明采用基于一维卷积的多尺度残差块，用高斯分量数为512的高斯混合模型对原始语音数据进行建模，提取相应的对数高斯概率特征，结合多尺度GMM‑MSNext模型能够有效提高说话人确认的性能。

主权项：1.一种融合GMM和ResNext的说话人确认方法，其特征在于，包括如下步骤：步骤S1：获取不同说话人的语音数据作为原始语音数据；步骤S2：计算原始语音数据的梅尔频率倒谱系数特征；步骤S3：在原始语音数据的梅尔频率倒谱系数特征上构建512阶高斯混合模型；步骤S4：将原始语音数据的梅尔频率倒谱系数特征作为512阶高斯混合模型的输入，计算得到512阶的对数高斯概率特征；步骤S5：构建多尺度ResNext模型，将计算得到的512阶的对数高斯概率特征作为多尺度ResNext模型的输入，对所述多尺度ResNext模型进行训练，将训练好的多尺度ResNext模型与512阶高斯混合模型组合成多尺度GMM-ResNext模型；多尺度ResNext模型由6个阶段组成；第一阶段依次由卷积核为3的一维卷积层、批量归一化层、ReLU非线性激活层组成，卷积核为3的一维卷积层的输入通道数和输出通道数均为512；第二阶段、第三阶段、第四阶段和第五阶段分别由3、3、9、3个多尺度残差块组成；第六阶段由注意力统计池化层和全连接层组成；第二阶段、第三阶段、第四阶段和第五阶段的多尺度残差块均为依次连接；步骤S6：将两条实时的语音数据导入多尺度GMM-ResNext模型对说话人进行确认，判断这两条实时的语音数据是否属于同一个说话人。

全文数据：

权利要求：

百度查询：江西师范大学一种融合GMM和ResNext的说话人确认方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种环保污水处理用紫外线消毒器

下一篇：一种园林养护用修枝装置

相关技术

一种环保污水处理用紫外线消毒器

一种园林养护用修枝装置

一种可在线拆换的VCM密闭取样三通器

一种外脚手架拉结点构件

电池封口装置

一种用于夜间钻探降噪及文明施工的围护设备

一种用于垃圾仓的具有散热功能的投射灯

一种材料转运用可调节式托盘架

一种风能利用的粮仓高效节能通风装置

一种新型材质的中央空调出风口

一种汽车仪表台生产模具

一种标准混合气的自动化配制装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合GMM和ResNext的说话人确认方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务