歌手识别方法、装置、设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：平安科技(深圳)有限公司

摘要：本发明涉及人工智能领域，公开了一种歌手识别方法、装置、设备及存储介质，用于提高歌手识别的准确率和效率。所述歌手识别方法包括：接收混合录音的待识别音频文件，并获取待识别音频文件的目标音频信号；根据预置的傅里叶变换算法，将目标音频信号转换到梅尔频域，得到待识别音频文件对应的音频梅尔频谱图；通过预置的基频提取算法，从音频梅尔频谱图中提取背景音乐部分的旋律梅尔频谱图；基于训练好的歌手识别模型，对音频梅尔频谱图和旋律梅尔频谱图进行歌手识别，得到待识别音频文件对应的歌手信息。此外，本发明还涉及区块链技术，歌手信息可存储于区块链节点中。

主权项：1.一种歌手识别方法，其特征在于，所述歌手识别方法包括：接收混合录音的待识别音频文件，并获取所述待识别音频文件的目标音频信号；根据预置的傅里叶变换算法，将所述目标音频信号转换到梅尔频域，得到所述待识别音频文件对应的音频梅尔频谱图；通过预置的基频提取算法，从所述音频梅尔频谱图中提取背景音乐部分的旋律梅尔频谱图；基于训练好的歌手识别模型，对所述音频梅尔频谱图和所述旋律梅尔频谱图进行歌手识别，得到所述待识别音频文件对应的歌手信息；在所述接收混合录音的待识别音频文件，并获取所述待识别音频文件的目标音频信号之前，所述歌手识别方法还包括：获取带歌手信息标注的初始样本音频文件，并通过预置的数据增强算法，对所述初始样本音频文件进行扩展，得到目标样本音频文件；获取初始化的卷积递归神经网络模型，并将所述目标样本音频文件输入所述卷积递归神经网络模型，所述卷积递归神经网络模型包括多个卷积层、多个门控循环单元层和全连接层；基于所述目标样本音频文件，对所述多个卷积层、所述多个门控循环单元层和所述全连接层进行模型训练，得到模型损失结果；根据所述模型损失结果，对所述卷积递归神经网络模型的网络参数进行调整，得到训练好的歌手识别模型；所述获取带歌手信息标注的初始样本音频文件，并通过预置的数据增强算法，对所述初始样本音频文件进行扩展，得到目标样本音频文件，包括：获取带歌手信息标注的多个初始样本音频文件，并将所述多个初始样本音频文件转化为样本音频信号，得到多个样本音频信号；通过预置的音乐分轨算法，分别将所述多个样本音频信号中的乐器音轨删除，得到多个人声信号；通过预置的基频提取算法，分别在所述多个样本音频信号中提取背景音，得到多个旋律信号；通过预置的数据增强算法，分别将各人声信号与所述多个旋律信号融合，得到目标样本音频文件；所述通过预置的基频提取算法，从所述音频梅尔频谱图中提取背景音乐部分的旋律梅尔频谱图，包括：通过预置的基频提取算法，从所述目标音频信号中提取基频信号，所述基频信号用于指示所述待识别音频文件的背景音乐部分信号；基于所述基频信号，对从所述音频梅尔频谱图进行卷积运算，得到所述音频梅尔频谱图中背景音乐部分的旋律梅尔频谱图；所述基于训练好的歌手识别模型，对所述音频梅尔频谱图和所述旋律梅尔频谱图进行歌手识别，得到所述待识别音频文件对应的歌手信息，包括：通过训练好的歌手识别模型中的多个卷积层和多个门控循环单元层，对所述音频梅尔频谱图和所述旋律梅尔频谱图进行卷积递归特征提取，得到所述待识别音频文件对应的特征矩阵；通过所述歌手识别模型中的全连接层，对所述特征矩阵进行歌手概率投票，并将投票概率最高的歌手信息作为所述待识别音频文件对应的歌手信息。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司歌手识别方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种有效微生物群活性菌剂及其应用方法

下一篇：一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

相关技术

一种有效微生物群活性菌剂及其应用方法

一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

一种汽车零部件冲压加工用夹具

挖掘装置极限工况的结构优化方法、装置、设备及介质

一种发动机选配零件装配过程人机交互防错装置及方法

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种汽车动力总成振动强度的分析方法、系统及介质

慢性低度炎症刺激形成衰老成纤维细胞模型的构建方法

纵置混动变速箱机械泵

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种高速砂尘温控系统

方法相关技术

煤的评价方法和混煤的制备方法以及焦炭的制造方法_杰富意钢铁株式会社_202080019357.8

蚀刻方法_株式会社力森诺科_202280091493.7

图像检测方法、模型训练方法及相关装置_马上消费金融股份有限公司_202410202420.1

测试结构、失效定位方法以及失效分析方法_上海华力微电子有限公司_202410692646.4

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

动态密钥生成方法、升级包加密方法、软件升级方法_广汽埃安新能源汽车股份有限公司_202410720762.2

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

搬运方法_浜松光子学株式会社_202410706496.8

接合体的制造方法及基材的制造方法_株式会社力森诺科_202280086405.4

一种后门攻击方法和防御方法_华中科技大学_202311273829.4

设备相关技术

显示设备和包括该显示设备的计算设备_乐金显示有限公司_202210245458.8

多设备的控制方法、主设备及从设备_广州视源电子科技股份有限公司_202310248719.6

导向设备、直线电机及加工设备_苏州维嘉科技股份有限公司_202310265507.9

电子设备及可穿戴设备_OPPO广东移动通信有限公司_202011148777.4

显示设备_三星显示有限公司_202410306296.3

测试设备_广东聚华新型显示研究院_202323294429.X

检测设备_珠海科创储能科技有限公司_202323641434.3

显示设备_三星显示有限公司_202110404317.1

烹饪设备_杭州老板电器股份有限公司_202322821125.8

清洁设备_深圳市元鼎智能创新有限公司_202410833156.1

装置相关技术

介质输送装置、记录装置、后处理装置、中继装置_精工爱普生株式会社_202410300920.9

介质输送装置、记录装置、后处理装置、中继装置_精工爱普生株式会社_202410300924.7

用户装置及基站装置_株式会社NTT都科摩_201980022638.6

振动装置和摄像装置_株式会社村田制作所_202280091042.3

开关装置及硬盘装置_罗姆股份有限公司_202410212540.X

输送装置以及记录装置_精工爱普生株式会社_202110116640.9

开关装置以及电源装置_罗姆股份有限公司_202280090632.4

电池单体、电池装置、用电装置及储能装置_宁德时代新能源科技股份有限公司_202411151297.1

凹凸辊、介质输送装置、后处理装置、中继装置_精工爱普生株式会社_202410301015.5

控温装置和皮肤处理装置_佛山市小熊健康电器有限公司_202420270871.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

歌手识别方法、装置、设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务