Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种听歌识人方法、终端设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门快商通科技股份有限公司

摘要:本发明涉及一种听歌识人方法、终端设备及存储介质,该方法中包括:采集单一说话人的音频构建第一训练集;构建基于卷积神经网络和残差神经网络的自监督学习模型;基于第一训练集中的音频的声学特征,对模型进行n次回归训练;基于第一训练集中的各音频,对模型进行第n+1次回归训练;基于第n+1次回归训练结果构建鉴别任务,将鉴别训练后的模型作为听歌识人模型;采集标注有歌手名音频数据对听歌识人模型进行分类训练,得到最终听歌识人模型;通过最终听歌识人模型对待识别歌曲的歌手进行识别。本发明无需支付高额版权费收集大量歌手歌曲,也无需人工对歌曲进行截取,只需要适量正常的带说话人标注的语音及歌手歌曲片段即可实现对听歌识人模型的训练。

主权项:1.一种听歌识人方法,其特征在于,包括以下步骤:S1:采集单一说话人的音频数据,并基于采集的音频数据构建第一训练集;S2:基于卷积神经网络和残差神经网络构建自监督学习模型;S3:基于第一训练集中的音频,通过不同方式提取n种不同类型的声学特征后,将提取的每个类型的声学特征作为一次回归任务的标签,对自监督学习模型进行n次回归训练;S4:将第一训练集中的各音频作为第n+1次回归任务的标签,对第n次回归训练后得到的自监督学习模型进行第n+1次回归训练;S5:基于第n+1次回归训练结果构建自监督学习模型的鉴别任务,提取第一训练集中包含的正样本对和负样本对,并通过正样本对和负样本对自监督学习模型的第n+1次回归训练结果进行鉴别训练,将鉴别训练后的自监督学习模型作为听歌识人模型;S6:采集标注有歌手名的独唱歌曲音频数据并进行声纹特征提取后,进行人声和伴奏声的分离,将歌手名和伴奏作为听歌识人模型分类任务的标签,基于分离后的音频数据构建第二训练集;S7:通过第二训练集对听歌识人模型进行分类训练,得到最终听歌识人模型;S8:通过最终听歌识人模型对待识别歌曲的歌手进行识别。

全文数据:

权利要求:

百度查询: 厦门快商通科技股份有限公司 一种听歌识人方法、终端设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。