厦门快商通科技股份有限公司张广学获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门快商通科技股份有限公司申请的专利一种时序声纹特征组合识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114203185B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111455835.2,技术领域涉及:G10L17/02;该发明授权一种时序声纹特征组合识别方法及装置是由张广学;肖龙源;李稀敏;叶志坚设计研发完成,并于2021-12-01向国家知识产权局提交的专利申请。
本一种时序声纹特征组合识别方法及装置在说明书摘要公布了:本发明涉及一种时序声纹特征组合识别方法及装置。其方法包括,获取音频信号的语音特征,对所述语音特征进行增强处理后语音特征输入至声纹识别网络模型,对声纹识别网络模型进行训练,直至所述声纹识别网络模型收敛。本发明通过对音频信号中语音特征在时间维度上的变化情况的增强处理,使得模型可以更精确地识别在一段时间内连续性的转变声纹特征状态,通过对于多时序特征的压缩,提高算法模型在语音和时间序列的信号处理上进行关联,可以对于同一个人在不同时刻持续变化的音频信号准确识别。
本发明授权一种时序声纹特征组合识别方法及装置在权利要求书中公布了:1.一种时序声纹特征组合识别方法,其特征在于:包括以下步骤, S1,获取音频信号的语音特征; S2,对所述语音特征进行增强处理,得到增强后的语音特征C,其中 ; 其中,Ct为t时刻的语音特征,W为语音特征连续变化的权重值,Ct+1为t+1时刻的语音特征,增强后的语音特征包括初始语音特征参数和变化语音参数; S3,将增强后的语音特征输入至声纹识别网络模型,对声纹识别网络模型进行训练,直至所述声纹识别网络模型收敛; 其中所述声纹识别网络模型包括:特征提取层; 所述特征提取层包括SE残差网络层和特征融合层,增强后的语音特征通过输入层进行预输入处理后,将输入的语音特征参数利用所述SE残差网络层进行特征降维以及维度回升处理后,得到语音特征矢量,将所述语音特征矢量通过所述特征融合层进行多层特征计算得到声纹特征向量; 所述声纹识别网络模型包括:输入层以及输出层,所述输入层为时延神经网络结构,其用于对增强后的语音特征进行预输入处理; 所述输出层包括注意力统计池化层和AAM-Softmax层,所述声纹特征向量通过所述注意力统计池化层对声纹分类概率进行池化,所述AAM-Softmax层用于根据声纹分类概率对所述音频信号进行声纹分类; 所述SE残差网络层包括多个SE残差网络结构,SE残差网络结构简称为SE-Res2Block, 当语音特征中初始语音特征参数输入至SE-Res2Block时,通过3×3卷积核运算对所有所述初始语音特征参数分别进行更新,对应得到变化语音特征参数; 当变化语音特征参数输入至SE-Res2Block时,将所述变化语音特征参数与与其对应的初始语音特征参数进行3×3卷积核运算,对所述变化语音特征参数进行更新后,得到当前SE-Res2Block的语音特征矢量并将所述当前SE-Res2Block的语音特征矢量输入至其他SE-Res2Block中,直至所述变化语音特征参数与所有所述初始语音特征参数进行3×3卷积核运算后,将多个SE-Res2Block的语音特征矢量,通过所述特征融合层进行多层特征计算得到声纹特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门快商通科技股份有限公司,其通讯地址为:351200 福建省厦门市软件园三期诚毅北大街63号1301单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励