基于深度自注意力神经网络分类器的合成语音检测方法

导航：龙图腾网> 最新专利技术> 基于深度自注意力神经网络分类器的合成语音检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国科学院声学研究所

摘要：本发明涉及合成语音鉴伪领域，特别涉及一种基于深度自注意力神经网络分类器的合成语音检测方法及系统，包括以下步骤：步骤1获得具有固定长度的待判别语音信号；步骤2提取预处理后的所述待判别语音信号的时频特征；步骤3通过一维卷积神经网络模块，对所述待判别语音信号的时频特征进行模式识别，以降低其时间分辨率；步骤4通过深度自注意力神经网络分类器，对输入的低时间分辨率语音特征进行鉴别，以确定所述待判别语音信号是否为合成语音。本发明利用深度自注意力神经网络分类器对输入语音特征的长时间相关关系进行学习，并根据语音特征的长时间相关关系进行真实语音和合成语音的判别，提升了合成语音检测的准确性。

主权项：1.一种基于深度自注意力神经网络分类器的合成语音检测方法，利用深度自注意力神经网络分类器对输入语音特征的长时间相关关系进行学习，并根据语音特征的长时间相关关系进行真实语音和合成语音的判别，包括以下步骤：步骤1通过语音预处理模块，对输入的待判别语音信号进行预处理，以获得具有固定长度的待判别语音信号；步骤2通过语音时频特征提取模块，提取预处理后的所述待判别语音信号的时频特征；步骤3通过一维卷积神经网络模块，对所述待判别语音信号的时频特征进行模式识别，以降低其时间分辨率，并将得到的语音特征输入至深度自注意力神经网络分类器；步骤4通过深度自注意力神经网络分类器，对输入的低时间分辨率语音特征进行鉴别，以确定所述待判别语音信号是否为合成语音；所述步骤4具体包括：步骤401通过位置信息嵌入层，在低时间分辨率的语音特征上嵌入的其位置信息，并通过深度自注意力神经网络编码器层获得序列输出步骤402将所述序列输出输入到只有一个节点的线性层，并通过线性层将其沿着第一个轴做软最大化操作，以得到序列输出在时间轴上的加权权值步骤403利用所述加权权值对序列输出各个时间帧进行加权平均，以得到用于判别的特征并将其输入到含有两个单元的线性层，分别输出真实语音和合成语音的概率，以确定所述待判别语音信号是否为合成语音；所述深度自注意力神经网络分类器对输入语音特征的长时间相关关系进行学习的具体步骤如下：S1利用三个包含E个节点的线性层，将一维卷积神经网络输出时频特征ε的每帧分别独立映射到深度自注意力神经网络编码器的嵌入维度E，得到第一线性层的输出Q、第二线性层的输出K和第三线性层输出V；所述第一线性层的输出Q、第二线性层的输出K和第三线性层输出V的时间帧数与一维卷积神经网络输出时频特征ε的时间帧数相同且与其每帧特征的维度N不同；其中，为第一维度为T且第二维度为E的实数矩阵，E为深度自注意力神经网络编码器的嵌入维度，T为一维卷积神经网络输出时频特征ε的时间帧数；S2计算未归一化的注意力矩阵A：其中，Kt为第二线性层的输出K的转置；对所述未归一化的注意力矩阵A的每一行进行软最大化操作以得到注意力矩阵其中，所述注意力矩阵含有一维卷积神经网络输出时频特征ε的长时间相关关系；S3计算未映射到目标空间的注意力输出O，以更新一维卷积神经网络输出时频特征ε各个时间帧上的特征；其中，所述未映射到目标空间的注意力输出O为： S4通过一个包含E个节点线性层将未映射到目标空间的注意力输出O在各个时间帧上的特征映射到深度自注意力神经网络编码器的嵌入维度，以得到深度自注意力神经网络编码器的输出其中，

全文数据：

权利要求：

百度查询：中国科学院声学研究所基于深度自注意力神经网络分类器的合成语音检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于3D TOF传感技术的家居服务一体机

下一篇：一种鼓风机用高补偿伸缩节

相关技术

基于3D TOF传感技术的家居服务一体机

一种鼓风机用高补偿伸缩节

一种偏振分光棱镜生产用涂胶设备

一种降尘设备

一种用于衣物回收的大型自助回收设备

一种可升降的计算机信息技术用设备

一种立式固井供液罐

一种多功能护理床

一种鞋盒

一种太阳能电池用防水除尘框架

拉杆防尘罩自动组装装置

一种用于固定装裱藏品的可拆卸网钩装置

器相关技术

电控变速器换挡器_新疆理工学院_202420558213.5

环形器和隔离器_江苏贝孚德通讯科技股份有限公司_201911138823.X

浮空器温控系统的控制方法、浮空器温控系统及浮空器_中国科学院空天信息创新研究院_202410876749.6

键盘端连接器、iPad端连接器及iPad连接器组件_深圳市步步精科技有限公司_202420861161.9

探测器控制装置、探测器控制方法以及探测器_株式会社东京精密_202280039695.7

变频器控制电路及变频器_国创能源互联网创新中心(广东)有限公司_202420483571.4

变换器控制方法、变换器和芯片_斯泰茵(苏州)能源科技有限公司_202410184337.6

变压器夹具及变压器夹持装置_埃斯凯(上海)电气科技股份有限公司_201810357965.4

穿刺器密封膜组件及穿刺器_微至(苏州)医疗科技有限公司_202322801351.X

空调器的控制方法和空调器_TCL空调器(中山)有限公司_202411173080.0

分类相关技术

基于主题预分类和知识图谱的多维文本分类方法_北京市新技术应用研究所有限公司_202411002529.7

满线轮分类码垛装置、绕线系统及满线轮分类码垛方法_苏州江锦自动化科技有限公司_202110424592.X

一种具有垃圾分类指导功能的生活垃圾分类屋_深圳市创辉煌环保科技发展有限公司_202420040748.3

一种分类模型的训练和文本分类方法、装置、电子设备_腾讯科技(深圳)有限公司_202310512241.3

用户分类方法及相关装置_博泰车联网科技(上海)股份有限公司_202010896133.7

基于模型的特征化和分类_格瑞尔有限责任公司_202080036172.8

一种试卷分类夹_山东商务职业学院_202420359596.3

一种聚氨酯分类筛网_福建奥晟科技有限公司_202420459508.7

基于频谱位置编码Transformer的音频分类模型训练方法、分类方法、存储介质及设备_哈尔滨理工大学_202410983886.X

一种多材质冷冻砂型分类回收设备_滁州市樵雅模具有限公司_202410816433.8

合成相关技术

玫瑰芳香的生物合成_新加坡科技研究局_202380026279.8

仲丁醇高效合成装置_山东齐鲁石化工程有限公司_202420233406.3

用于控制合成回路的方法_卡萨勒有限公司_202380029527.4

纯化合成气的工艺_普莱克斯技术有限公司_202080102993.7

一种合成反应装置_湖北德丽医药科技有限公司_202420323464.5

PCD镗铣复合成型刀_威士精密工具(上海)有限公司_202420484744.4

合成甲硫醇钠的微通道反应系统及甲硫醇钠的合成方法_蓝星安迪苏南京有限公司_202410982135.6

一种合成革加工用喷水装置_丽水市博而达新材料科技有限公司_202420435511.5

文本到人体动作合成方法及装置_世优宇宙(成都)科技有限公司_202411044244.X

一种合成二甘油的方法_东莞理工学院_202410955944.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度自注意力神经网络分类器的合成语音检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务