Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安交通大学李晨获国家专利权

西安交通大学李晨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安交通大学申请的专利一种音频处理方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120071875B

龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510421243.0,技术领域涉及:G10H1/00;该发明授权一种音频处理方法及相关装置是由李晨;李雅楠;庞善民;田丽华;祝继华;张玉龙;孙增国;昝鑫;刘焕;焦艳爽;赵培鹏设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。

一种音频处理方法及相关装置在说明书摘要公布了:本发明属于音乐信息检索领域,具体涉及一种音频处理方法及相关装置。音频处理方法包括以下步骤:对音频文件进行预处理,转换为频谱图;采用预先构建的特征提取模型对频谱图进行特征提取,得到特征向量;采用预先构建的基于流Transformer编码器的神经网络模型对特征向量进行处理,得到节拍激活值和强拍激活值;基于节拍激活值和强拍激活值,采用概率模型推断得到节拍序列和强拍序列。解决了现有方法存在的无法准确跟踪节拍序列问题。

本发明授权一种音频处理方法及相关装置在权利要求书中公布了:1.一种音频处理方法,其特征在于,包括以下步骤: S1、对音频文件进行预处理,转换为频谱图; S2、采用预先构建的特征提取模型对频谱图进行特征提取,得到特征向量; S3、采用预先构建的基于流Transformer编码器的神经网络模型对特征向量进行处理,得到节拍激活值和强拍激活值; S4、基于节拍激活值和强拍激活值,采用概率模型推断得到节拍序列和强拍序列; S2中,所述预先构建的特征提取模型包括依次连接的二维卷积层、第一最大池化层、频时注意力模块、第二最大池化层和深度可分离卷积层; 特征提取的过程具体为: S2.1、采用二维卷积层对频谱图进行通道初步扩展,得到多通道时频特征向量; S2.2、采用第一最大池化层降低多通道时频特征向量的频率维大小,得到一次降维的时频特征向量; S2.3、采用频时注意力模块在时间维度和频率维度上对一次降维的时频特征向量进行加权,同时将通道数再次扩展,得到频时注意后的时频特征向量; S2.4、采用第二最大池化层降低频时注意后的时频特征向量的频率维大小,得到二次降维的时频特征向量; S2.5、采用深度可分离卷积层将二次降维的时频特征向量的通道数再次扩展,得到特征向量; S3中,所述预先构建的基于流Transformer编码器的神经网络模型包括依次连接的流Transformer编码器、线性层和非线性激活函数层; 所述流Transformer编码器包括依次连接的注意力层、拼接层、全连接层和前馈层,注意力层分为多头自注意力层和外部注意力层; 所述流Transformer编码器基于上下文分块处理机制先对S2得到的特征向量进行分块处理; 多头自注意力层和外部注意力层分别计算出注意力特征向量,通过拼接层将两个注意力特征向量进行拼接,得到拼接后的特征向量; 通过全连接层对拼接后的特征向量进行恢复,得到恢复后的特征向量;所述恢复后的特征向量与流Transformer编码器的输入特征向量维度相同; 再由前馈层提取恢复后的特征向量的深层信息,最后通过线性层和非线性激活函数层对深层信息进行融合,得到节拍激活值和强拍激活值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。