杭州电子科技大学简志华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种采用双维度图注意力的伪造语音检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119864053B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510026212.5,技术领域涉及:G10L25/51;该发明授权一种采用双维度图注意力的伪造语音检测方法是由简志华;梁承涵;蔡逸;闫铎文;谈林涛;杨曼设计研发完成,并于2025-01-08向国家知识产权局提交的专利申请。
本一种采用双维度图注意力的伪造语音检测方法在说明书摘要公布了:本发明涉及一种采用双维度图注意力的伪造语音检测方法,对原始语音进行预加重处理,提取每一帧的线性频率倒谱系数特征;根据线性频率倒谱系数特征并使用BP算法对真实语音和伪造语音进行GMM建模,采用期望最大化算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP,再减去常数项并进行标准化处理;本发明通过采用双向细分法BP对高斯混合模型进行建模,使相邻高斯分量的均值向量差异较小,不仅使二维卷积能够有效地捕捉高斯分量之间的依赖关系,为图注意力模块提供更明确、更紧密的特征关系,增强注意力机制对全局特征的表征能力,该方法从局部到全局优化特征空间结构,提升伪造语音检测的性能。
本发明授权一种采用双维度图注意力的伪造语音检测方法在权利要求书中公布了:1.一种采用双维度图注意力的伪造语音检测方法,其特征在于:包括以下步骤: 步骤一:先对原始语音进行预加重处理,增强高频部分波形的细节,然后进行加窗分帧,提取每一帧的线性频率倒谱系数特征; 步骤二:根据线性频率倒谱系数特征并使用BP算法分别对真实语音和伪造语音进行GMM建模,采用期望最大化算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP,再减去常数项并进行标准化处理; 步骤三:将LGP特征矩阵输入到六个残差块模块,每个残差块由两个二维卷积层、一个SeLU激活函数和批量归一化层组成,分别在前四个残差块的末尾添加2×2的最大池化层,降低复杂度并提高泛化能力; 步骤四:将残差块生成的深层特征分别输入时间注意力模块和高斯分量注意力模块,得到相同维度但数量不同的图节点,两个注意力模块均包含图注意力网络和图池化模块,后将两个网络分别得到的图节点拼接,输入高斯分量-时间联合图注意力模块,得到最终的图节点; 步骤五:对伪造语音和真实语音的输入特征LGP以并行方式处理,将双方节点展平并拼接为全连接层的输入,生成真伪两个类别的置信度,通过softmax函数将置信度转化为概率,使用加权交叉熵损失函数计算实际标签与预测标签之间的误差,最小化损失以优化模型的分类性能,提高对语音真伪判决的准确性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。