首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

歌手识别领域中的专辑效应抑制方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津大学

摘要:本发明公开了一种歌手识别领域中的专辑效应抑制方法及系统。该方法包括获取样本歌曲,并进行预处理,得到声学特征;将声学特征输入歌手识别模型中,采用特征提取器对得到的声学特征进行提取,得到歌手声纹特征,将歌手声纹特征输入鉴别器中,进行重新编码,将重新编码后的声纹特征输入分类器中,进行分类;对歌手识别模型的歌手声纹编码器和鉴别器进行对抗训练;将待测试歌曲输入对抗训练后的歌手识别模型中,得到歌手识别结果。通过该方法进行训练,歌手声纹编码器能够减轻不同专辑之间的差异,从而提高歌手分类器对不同专辑的鲁棒性。有效地解决了歌手识别中的专辑效应问题。

主权项:1.一种歌手识别领域中的专辑效应抑制方法,其特征在于,包括如下步骤:S1、获取样本歌曲,并对样本歌曲进行预处理,得到声学特征;S2、将声学特征输入歌手识别模型中,所述歌手识别模型包括歌手声纹编码器和鉴别器;所述歌手声纹编码器包括特征提取器和分类器;采用特征提取器对得到的声学特征进行提取,得到歌手声纹特征,将歌手声纹特征输入鉴别器中,进行重新编码,将重新编码后的声纹特征输入分类器中,进行分类;S3、对歌手识别模型的歌手声纹编码器和鉴别器进行对抗训练,设置如下公式1和公式2所示的损失函数:使歌手声纹编码器提取的特征能同时满足欺骗鉴别器且分类器分类正确两个目标;minFVBGF=E[LDFzalbum_sourablum_tar+Lzalbum_sourablum_tar]公式1maxDVBGD=E[LDzalbum_sour]-kt*E[LDzalbum_tar]公式2其中,E表示期望,VBGF表示歌手声纹编码器的对抗训练损失值,zalbum_sourablum_tar表示源域和目标域专辑的歌唱语音信号;L表示分类器损失,LD表示自编码器损失;VBGD表示鉴别器的对抗训练损失值;zalbum_sour表示源域专辑歌唱语音信号,zalbum_tar表示目标域专辑歌唱语音信号,kt为平衡项参数;S4、将待测试歌曲输入对抗训练后的歌手识别模型中,得到歌手识别结果。

全文数据:

权利要求:

百度查询: 天津大学 歌手识别领域中的专辑效应抑制方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。