惠州中哲尚蓝柏科技有限公司彭子源获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉惠州中哲尚蓝柏科技有限公司申请的专利基于音频识别的分类播放方法、音响、设备及可存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118972752B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411033880.2,技术领域涉及:H04R3/12;该发明授权基于音频识别的分类播放方法、音响、设备及可存储介质是由彭子源;甄亮设计研发完成,并于2024-07-30向国家知识产权局提交的专利申请。
本基于音频识别的分类播放方法、音响、设备及可存储介质在说明书摘要公布了:本发明属于音频检测技术领域,提供了一种基于音频识别的分类播放方法、音响、设备及可存储介质。方法包括:获取音频信息;基于CNN网络、长短期记忆网络、多模态紧凑双线性池化和分类器构成的检测模型,对音频信息进行分类;根据分类结果,为音频信息匹配对应的播放模式,并使得扬声器在播放音频信息时切换至播放模式,播放模式包括音乐、电影、人声、运动、游戏、节日的一种,以及在播放模式为音乐时,根据分类结果所确定音乐流派,选择对应的均衡器播放效果;本发明可以解决现有技术中音频播放中遇到的问题。
本发明授权基于音频识别的分类播放方法、音响、设备及可存储介质在权利要求书中公布了:1.一种基于音频识别的分类播放方法,其特征在于,所述方法运行于音响设备、计算机或移动设备中,所述方法包括: 获取音频信息; 基于CNN网络、长短期记忆网络、多模态紧凑双线性池化和分类器构成的检测模型,在训练后对所述音频信息进行分类,其中,在分类时仅将所述音频信息的梅尔频谱作为输入,通过所述CNN网络的堆叠的卷积池化层提取音频特征,将注意力机制和所述长短期记忆网络结合,在所述音频信息存在歌词时,提取所述歌词中的重要字词,形成歌词特征,在所述音频信息无歌词时,形成预设的填充特征,利用所述多模态紧凑双线性池化,将所述歌词特征与所述音频特征连接,或将所述填充特征与所述音频特征连接,得到组合特征,并将所述组合特征输入到由全连接层和softmax函数组成的所述分类器中,得到所述音频信息的分类结果; 在提取所述歌词特征时,具体包括:对所述歌词进行分词,形成以热向量表示的字词集合;将所述字词集合中的每个字词嵌入到向量空间中,其中,,,为所述字词集合,为参数矩阵,和分别表示歌词字词嵌入的维度和长度;基于长短期记忆网络,提取所述向量空间的每个字词的高级特征,高级特征为,,高级特征在计算时,,是长短期记忆网络的参数,是长短期记忆网络的大小,根据所述歌词中的每个字词对音乐流派分类的影响,使用注意力机制为每个字词分配不同的权重,权重在计算时,,是指数函数,,参数K和b分别是学习到的权重矩阵和偏差项,是激活函数Tanh;使用加权和计算每个加权后的字词的高级特征的关注特征,计算的公式为:,得到所述歌词特征,表示为:,参数表示为权重参数,为第个音频; 根据所述分类结果,为所述音频信息匹配对应的播放模式,并使得扬声器在播放所述音频信息时切换至所述播放模式,所述播放模式包括音乐、电影、人声、运动、游戏、节日的一种,以及在所述播放模式为音乐时,根据所述分类结果所确定音乐流派,选择对应的均衡器播放效果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人惠州中哲尚蓝柏科技有限公司,其通讯地址为:516055 广东省惠州市仲恺高新区东江产业园东兴片区东新大道106号创新大厦2楼205-A号房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励