Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于关联特征判别性融合网络的伪造语音检测方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:一种基于关联特征判别性融合网络的伪造语音检测方法及系统,属于语音处理及生物识别技术领域。本发明首先对语音进行预处理并CQT特征,将其作为双向注意力网络和SCG‑Res2Net50这个两个平行网络的输入,在训练阶段通过关联特征判别性融合方法进行网络参数初始化,将初始化投影矩阵参数与原特征相乘得出转换后的新特征,再将两个特征拼接,然后将此拼接后的特征输入全连接层分类,得到训练好的网络模型,用于作为真实语音与欺诈语音的分类器,根据全连接层输出中的两个数值相减的结果进行真实语音与伪造语音的分类。

主权项:1.一种基于关联特征判别性融合网络的伪造语音检测方法,其特征在于,包括:对语音数据提取CQT特征矩阵,并将CQT矩阵输入判识模型,判识模型的处理过程包括:首先将CQT矩阵输入双向注意力网络和SCG-Res2Net50这个两个双并行网络,通过双并行网络得到两个高级表示特征矩阵,表示为X和Y;所述双向注意力网络处理过程如下:首先通过第一特征提取网络进行特征提取,得到语音的嵌入特征;然后将语音的嵌入特征转换为一维序列,分别输入到正向GRU和反向GRU网络中提取时序特征,GRU为门控制循环单元;将正向GRU网络、反向GRU网络得到的时序特征分别通过自注意力网络,然后将输出进行拼接,再通过一个全连接层得到双向注意力网络输出的特征;针对特征矩阵X和Y,分别求出两个特征矩阵的类间散度矩阵Sbx、Sby和两个类内散度矩阵Swx、Swy;然后将类内散度矩阵的逆和类间散度矩阵相乘Swx-1Sbx,将其称为联合类内间散度矩阵,对联合类内间散度矩阵进行特征分解,求出特征向量P和特征值Λ;利用将特征矩阵X进行投影得到对应的投影矩阵X′=WbxX;采用相同的方式得到并将特征矩阵Y的投影矩阵进行投影,得到对应的投影矩阵Y'=WbyY;将得到X′和Y'作相关性变换,确定集间协方差矩阵S′xy=X′Y′T,然后利用奇异值分解对S′xy进行对角化,得到S′xy=U∑VT,其中U和V是奇异值分解后的正交矩阵,∑是一个对角矩阵,对角元素为奇异值;令Wcx=U∑-12,Wcy=V∑-12,将Wcx和Wcy作为X′和Y′的投影矩阵进行投影得到X*=WcxX'和Y*=WcyY';再将X*和Y*拼接起来得到特征融合后特征,再通过一个全连接层,全连接层输出维度是2,分别是表示裁定样本是伪造语音的节点数值和裁定样本是真实语音的节点数值,即判识模型最终输出out={neg_score,pos_score},其中neg_score为裁定伪造语音节点数值,pos_score为裁定真实语音节点数值;最后根据判识模型最终输出out中的两个数值相减的结果进行真实语音与伪造语音的分类。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 一种基于关联特征判别性融合网络的伪造语音检测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。