中国人民解放军军事科学院国防科技创新研究院刘峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院国防科技创新研究院申请的专利基于位置编码卷积神经网络的声音定位识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114420150B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111654890.4,技术领域涉及:G10L25/03;该发明授权基于位置编码卷积神经网络的声音定位识别方法及装置是由刘峰;李岱徽;陈亮;沈同圣;赵德鑫;丁昊设计研发完成,并于2021-12-30向国家知识产权局提交的专利申请。
本基于位置编码卷积神经网络的声音定位识别方法及装置在说明书摘要公布了:本发明提供一种基于位置编码卷积神经网络的声音定位识别方法及装置,该方法包括:将目标声源信号输入多任务模型中的编码模型,得到目标声源信号的编码结果;将目标声源信号和编码结果输入多任务模型中的特征提取模型,得到目标声源信号的特征向量;将目标声源信号的特征向量输入多任务模型中的解码模型,得到目标声源信号的解码结果;将目标声源信号的解码结果输入多任务模型中的定位识别模型,得到目标声源信号的定位结果和识别结果。本发明实现消除特征向量中的时间位置信息干扰,从目标声源信号中深度挖掘影响定位任务和识别任务的本质特征,并充分考虑定位任务和识别任务之间的相关性和差异性,有效提高目标声源信号的定位精度和识别精度。
本发明授权基于位置编码卷积神经网络的声音定位识别方法及装置在权利要求书中公布了:1.一种基于位置编码卷积神经网络的声音定位识别方法,其特征在于,包括: 将目标声源信号输入多任务模型中的编码模型,得到所述目标声源信号的编码结果;其中,所述编码模型用于对所述目标声源信号进行位置信息编码; 将所述目标声源信号和所述编码结果输入所述多任务模型中的特征提取模型,得到所述目标声源信号的特征向量; 将所述目标声源信号的特征向量输入所述多任务模型中的解码模型,得到所述目标声源信号的解码结果; 将所述目标声源信号的解码结果输入所述多任务模型中的定位识别模型,得到所述目标声源信号的定位结果和识别结果; 其中,所述多任务模型基于样本声源信号和所述样本声源信号对应的参考定位结果和参考识别结果训练得到; 所述特征提取模型包含至少一组位置信息保持模块和池化模块; 所述位置信息保持模块包含多个不同尺度的第一卷积模块,以及第二卷积模块; 多个不同尺度的第一卷积模块,用于对所述目标声源信号和所述编码结果进行多尺度特征提取,得到所述目标声源信号的多个不同尺度的特征向量; 第二卷积模块,用于对多个不同尺度的特征向量进行融合; 所述池化模块,用于对融合结果进行池化操作; 所述位置信息保持模块包括多个卷积模块分别为A1、A2、B1、B2、B3;A1、A2、B1和B2的卷积核大小均为3x3,步长均为1;B3的卷积核大小为3x3,步长为2;所述多个不同尺度的第一卷积模块包括第一卷积模块F1、第一卷积模块F2和第一卷积模块F3,所述第一卷积模块F1是将A1和B1进行顺序连接构成的一个不同尺度的第一卷积模块,所述第一卷积模块F2是将A1和A2并行连接后与B2顺序连接构成的一个不同尺度的第一卷积模块,所述第一卷积模块F3是基于B3构成的一个不同尺度的第一卷积模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院国防科技创新研究院,其通讯地址为:100071 北京市丰台区东大街53号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。