Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南理工大学周永靖获国家专利权

华南理工大学周永靖获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南理工大学申请的专利基于区分性表征损失与注意力卷积网络的声音辨识方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119541545B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411733651.1,技术领域涉及:G10L25/51;该发明授权基于区分性表征损失与注意力卷积网络的声音辨识方法是由周永靖;李艳雄;申桥缙设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。

基于区分性表征损失与注意力卷积网络的声音辨识方法在说明书摘要公布了:发明公开了一种基于区分性表征损失与注意力卷积网络的声音辨识方法,包括下列步骤:首先采集环境声音音频样本;接着对音频样本进行预处理,提取对数梅尔谱特征;然后将对数梅尔谱特征依次输入注意力卷积网络,并采用由特征损失和交叉熵损失确定的区分性损失函数监督注意力卷积网络训练;最后将待测音频样本的对数梅尔谱特征输入训练后的注意力卷积网络,得到待测样本的声音辨识结果。本发明方法设计一个并联架构的注意力卷积网络,并定义一种区分性损失函数监督注意力卷积网络的训练。本发明方法可以有效提取音频样本中的全局与局部时频信息,并具有更佳的类内紧凑性和类间分离性。与传统方法相比,本发明方法具有更优的声音辨识性能。

本发明授权基于区分性表征损失与注意力卷积网络的声音辨识方法在权利要求书中公布了:1.一种基于区分性表征损失与注意力卷积网络的声音辨识方法,其特征在于,所述声音辨识方法包括以下步骤: S1、采集音频样本:将拾音器放置在待测区域内,采集该待测区域的声音得到音频样本; S2、提取对数梅尔谱特征:对每个采集得到的音频样本进行预加重、分帧和加窗处理,通过快速傅里叶变换得到音频样本的线性频谱,经滤波器组和对数运算后得到音频样本的对数梅尔谱特征; S3、搭建注意力卷积网络:搭建由并联的卷积变换模块和注意力变换模块组成的注意力卷积网络; S4、训练注意力卷积网络:在区分性损失函数的监督下,将训练音频样本的对数梅尔谱特征作为输入,训练注意力卷积网络;其中,所述区分性损失函数定义如下: 将第r类音频的原型记为Mr,定义为第r类音频所有音频样本的特征向量Ar的平均向量,则Mr的计算公式为,其中,R为音频样本的种类数量;使用交叉熵损失和特征损失相加构成的总损失共同训练注意力卷积网络,总损失定义为,其中,和定义如下: 其中,为预测结果,表示预测结果为第r类音频,表示在音频样本表征为Ar时,辨识结果为第r类的概率,表示音频损失,表示音频之间的交叉损失,定义如下: 其中,表示除第r类音频外的其他类音频,,表示在平行于方向的分量,表示在垂直于方向的分量,表示在平行于方向的分量,表示在垂直于方向的分量,Rr为第r类音频的音频样本数量; 其中和定义如下: 在的监督下,Ar的平行分量和垂直分量相对于第r类音频的原型将分别得到最大值和最小值,如果音频分类效果较好,则Ar会接近于Mr; 在的监督下,音频表征Ar平行分量和垂直分量相对于其他音频类别将分别最小化和最大化; S5、辨识待测样本的声音类别:将待测样本的对数梅尔谱特征作为注意力卷积网络的输入,得到待测样本的声音辨识结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。