买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:新疆大学
摘要:本发明公开一种基于改进Sinc卷积层和Transformer的合成语音检测方法,属于语音处理领域。该方法包括以下步骤:首先,使用Sinc卷积层作为特征提取前端,并通过ERB设置其截止频率以关注低频部分的伪影信息;其次,通过基于Resnet的深度特征提取器对获取到的初级特征进行深度特征提取,得到带有局部信息的深度特征,并使用基于时频域分离的降维方式对提取的深度特征进行降维,得到时域序列和频域序列;对输出序列进行正弦位置编码后,将序列分别输入至两个基于Transformer编码器的路径中以获取全局依赖信息;最终将两个路径的输出通过逐元素相乘进行融合以输出话语级表示并输入至全连接层以获取待测语音的真伪结果。通过这种高效、轻量级的结构,本发明能够在不增加额外计算负担的情况下,提高检测性能,适用于嵌入式设备上的合成语音检测应用。
主权项:1.一种基于改进Sinc卷积层和Transformer的合成语音检测方法,其特征在于,包括以下步骤:1将预处理后的语音输入至Sinc卷积层进行带通滤波并使用自适应最大池化层降低冗余信息以得到初级特征;2通过基于Resnet的深度特征提取器对获取到的初级特征进行深度特征提取,得到带有局部信息的深度特征;3使用基于时频域分离的降维方式对提取的深度特征进行降维,得到时域序列和频域序列;4对输出序列进行正弦位置编码后,将序列分别输入至两个基于Transformer编码器的路径中以获取全局依赖信息;5将两个路径的输出通过逐元素相乘进行融合以输出话语级表示并输入至全连接层以获取待测语音的真伪结果。
全文数据:
权利要求:
百度查询: 新疆大学 基于改进Sinc卷积层和Transformer的合成语音检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。