中国民用航空飞行学院潘卫军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国民用航空飞行学院申请的专利一种面向短语音与复杂噪声的陆空通话说话人识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120148524B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510609028.3,技术领域涉及:G10L17/20;该发明授权一种面向短语音与复杂噪声的陆空通话说话人识别方法是由潘卫军;陈申豪;王泆棣;陈晟;梁叡涵;王钰皓;张琛;宋大江;冯玉江;王琪翔;郑耀;王玄;左青海;王润东;栾天设计研发完成,并于2025-05-13向国家知识产权局提交的专利申请。
本一种面向短语音与复杂噪声的陆空通话说话人识别方法在说明书摘要公布了:本发明涉及声纹识别技术领域,公开了一种面向短语音与复杂噪声的陆空通话说话人识别方法,通过自适应滤波器结合最小均方算法动态抑制背景噪声,提升语音信号质量;采用多尺度特征融合技术,结合短时傅里叶变换、滤波器组能量特征及多尺度卷积,引入随机时间与频率遮蔽的数据增强策略,增强短语音特征表达能力;并在ECAPA‑TDNN模型中集成Bi‑GRU,通过上下文时序建模捕捉多轮对话的语境信息,提升动态场景下的识别稳定性;采用AAM‑Softmax损失函数强化模型区分能力,最终通过余弦相似度匹配实现身份判定。本发明显著提升了复杂噪声与短语音条件下的声纹识别精度与鲁棒性,有效降低航空通信中因身份误判引发的安全风险。
本发明授权一种面向短语音与复杂噪声的陆空通话说话人识别方法在权利要求书中公布了:1.一种面向短语音与复杂噪声的陆空通话说话人识别方法,其特征在于,包括以下步骤:步骤1:语音信号输入; 通过航空通信设备实时采集管制员与飞行员的语音信号; 步骤2:语音信号预处理; 对所述语音信号进行噪声抑制,包括采用自适应滤波器对参考噪声信号建模,通过最小均方算法动态调整滤波器权重,抑制背景噪声; 步骤3:多尺度特征提取; 对降噪后的语音信号进行多尺度特征提取融合,包括短时傅里叶变换、滤波器组能量特征提取及多尺度卷积特征提取,并结合随机时间遮蔽与频率遮蔽进行数据增强; 步骤4:训练改进的ECAPA-TDNN模型; 用真实陆空通话语音数据对改进的ECAPA-TDNN模型进行训练,所述改进的ECAPA-TDNN模型包含SE-Res2Block模块和双向门控循环单元,用于提取局部声纹特征并捕捉上下文时序信息;训练过程中引入AAM-Softmax损失函数以提高模型的辨识能力; 步骤5:身份匹配与判定; 将待识别的音频样本输入训练好的改进的ECAPA-TDNN模型中,提取对应的高维特征向量,并计算待识别语音的声纹嵌入向量与声纹数据库中已注册说话人的声纹嵌入向量的余弦相似度,选取最高相似度对应的身份作为识别结果; 所述步骤4中,训练改进的ECAPA-TDNN模型具体包括: 步骤4.1:对输入的多尺度语音特征X0,进行一维卷积操作,采用ReLU激活函数和批归一化进行特征变换,计算过程如下: ; 其中,是1维卷积核权重,是偏置项;输出信号,代表通道数,为时间步长;为批归一化处理;ReLU为激活函数,Conv1D为一维卷积操作; 步骤4.2:通过SE-Res2Block模块进行深度特征提取;所述SE-Res2Block模块包含三层卷积单元,卷积核大小设为,并分别采用膨胀率的空洞卷积以增强感受野,同时结合SE机制自适应调整通道权重;第个SE-Res2Block模块的输出计算如下: ; 其中,扩张卷积采用不变,扩张系数d随层递增;;X i 和X i+1分别为第i个SE-Res2Block模块输入和输出;SE-Res2Block表示SE-Res2Block模块处理; 三层SE-Res2Block的输出进行拼接: ; 其中,Concat表示拼接操作; 步骤4.3:引入双向门控循环单元对特征序列进行处理,所述双向门控循环单元由前向GRU和后向GRU组成;将拼接后的输出送入引入双向门控循环单元进行双向序列建模,分别计算前向和后向隐藏状态: ; ; 其中,,和分别为前向GRU和后向GRU的隐藏状态;为GRU隐藏单元数;GRUfwd为前向GRU处理,GRUbwd为后向GRU处理; 双向门控循环单元拼接前向GRU和后向GRU的隐藏状态后输出: ; 其中,表示拼接前向GRU和后向GRU隐藏状态后的特征维度;T为时间步长; 步骤4.4:经过卷积激活归一化层后输出: ; 其中,、和分别为卷积激活归一化层的输出、权重和偏置; 采用注意力池化层计算全局特征,得到向量: ; 其中,ASP为注意力池化层计算; 接着经过池化层的向量进入全连接归一化层输出声纹嵌入码向量: ; 其中,FC为全连接层处理; 步骤4.5:使用AAM-Softmax损失函数指导训练,直至模型训练收敛获得满足性能要求的种子模型: ; 其中,表示真实标签,是训练样本的平均损失值;AAMLoss为应用加性角度间隔损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国民用航空飞行学院,其通讯地址为:618307 四川省德阳市广汉市南昌路四段46号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。