中国人民解放军海军航空大学张威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军海军航空大学申请的专利一种基于动态声学掩蔽的航空管制音频编码方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120636422B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511121490.5,技术领域涉及:G10L19/16;该发明授权一种基于动态声学掩蔽的航空管制音频编码方法及系统是由张威;吕友彬;付熙文;李煊;王翔;刘超慧;刘刚;邢淇凯翔;高龙;刘剑超设计研发完成,并于2025-08-12向国家知识产权局提交的专利申请。
本一种基于动态声学掩蔽的航空管制音频编码方法及系统在说明书摘要公布了:本发明属于音频编码技术领域,具体公开一种基于动态声学掩蔽的航空管制音频编码方法及系统,包括:采集航空管制音频信号,并进行复数短时傅里叶变换生成音频时频图;将时频图输入至个性化听觉特征提取模型,提取生理特征图与动态权重矩阵,融合生成最终掩蔽矩阵;将掩蔽矩阵与时频图进行哈达玛积,得到感知显著图;基于感知显著图提取音频特征,构建基础码本与树形残差码本进行分层向量量化压缩,输出压缩表示;将压缩表示转换为由基础索引、路径索引和终止标志位组成的编码三元组,作为最终编码结果。该方法适应个体听觉差异,提升指令可懂度和压缩效率,适用于高噪声航空通信场景。
本发明授权一种基于动态声学掩蔽的航空管制音频编码方法及系统在权利要求书中公布了:1.一种基于动态声学掩蔽的航空管制音频编码方法,其特征在于,包括以下步骤: 步骤S1、采集航空管制人员的音频信号,对音频信号进行处理后得到音频时频图; 步骤S2、将音频时频图输入至个性化听觉特征提取模型中,提取特征并生成最终掩蔽矩阵; 个性化听觉特征提取模型包括生理特征分支和注意力感知分支; 生理特征分支对音频时频图进行特征图的提取; 注意力感知分支对音频时频图进行动态权重矩阵的提取; 特征图与动态权重矩阵通过频带注意力融合,生成最终掩蔽矩阵; 生理特征分支包含Mel滤波器组和1D卷积; 使用Mel滤波器组对音频时频图中的时频表示进行特征学习; Mel滤波器组的参数初始化为Bark尺度分布,Bark尺度分布通过反向传播调整; 使用Mel滤波器组的计算公式为: 基于后接3层1D卷积与Mish激活函数,获得特征图 注意力感知分支将频谱划分为24个临界频带,计算各子带能量: 代表第b个临界频带内所包含的频率集合,其中b取值范围与临界频带划分数量相关,b取值为从1到24; 对集合内所有频率对应的进行求和,得到该临界频带子带的能量;经过1个门控循环单元,获得初始动态权重矩阵,通过2个全连接层,获得最终的动态权重矩阵 步骤S3、将最终掩蔽矩阵与音频时频图进行哈达玛积,得到感知显著图; 步骤S4、基于感知显著图提取音频特征,对音频特征进行压缩编码,获得对应的压缩表示; 步骤S5、将压缩表示转换为编码三元组,作为对应音频信号的最终编码结果并输出; 编码三元组由基础索引、路径索引与终止标志位组成,分别用于表示原型码本索引、分层路径索引与动态量化终止标志。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军航空大学,其通讯地址为:264001 山东省烟台市芝罘区二马路188号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励