Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多路径网络的说话人确认欺骗检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江西师范大学

摘要:本申请提供一种基于多路径网络的说话人确认欺骗检测方法,包括:获取说话人真实语音数据和欺骗语音数据;采用编解码器对所获取的语音进行数据增强,提取所有语音数据的线性频率倒谱系数特征;将编解码方式不同的语音视为来自不同的域,用高斯混合模型提取各域语音的高斯概率特征;构建多路径神经网络,每个域的高斯概率特征分别作为一个神经网络路径的输入;对所述多路径网络进行训练;获取新的说话人语音,对新的语音进行欺骗检测。本发明用高斯混合模型提取各域语音的高斯概率特征,使用多路径网络模型判断语音是真实语音还是欺骗语音,提高了语音欺骗检测系统的泛化性。

主权项:1.一种基于多路径网络的说话人确认欺骗检测方法,其特征在于,包括以下步骤:S1、获取说话人真实语音数据及欺骗语音数据作为原始语音数据,并对所述原始语音数据分别进行PCM-alaw编解码和PCM-mulaw编解码,得到PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据;S2、分别计算所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征;S3、将所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据视为来自不同域的语音数据,采用单独的高斯混合模型对所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征分别进行建模,并分别在所述不同域的语音数据上进行训练,得到针对不同域的高斯混合模型,包括原始语音高斯混合模型、PCM-alaw语音高斯混合模型和PCM-mulaw语音高斯混合模型;S4、将所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征同时作为原始语音高斯混合模型、PCM-alaw语音高斯混合模型和PCM-mulaw语音高斯混合模型的输入,分别计算得到基于原始语音高斯混合模型、PCM-alaw语音高斯混合模型、PCM-mulaw语音高斯混合模型的概率特征;S5、构建多路径GMM-MobileNet网络,将基于所述原始语音高斯混合模型、PCM-alaw语音高斯混合模型、PCM-mulaw语音高斯混合模型的概率特征分别作为各自MobileNet网络路径的输入,对所述多路径GMM-MobileNet网络进行训练,训练好的多路径GMM-MobileNet网络模型用于对新的语音数据进行欺骗检测。

全文数据:

权利要求:

百度查询: 江西师范大学 一种基于多路径网络的说话人确认欺骗检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。