首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于扩散模型的音乐音色风格转换方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州市车厘子电子科技有限公司

摘要:本发明公开了基于扩散模型的音乐音色风格转换方法及系统,包括:构建潜在扩散模型,获取输入文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,通过训练输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐。本发使用潜在扩散模型来进行音乐音色风格迁移,直接从风格音乐中学习艺术风格,然后指导合成,能够高效、准确地学习音乐中的关键信息,从而捕捉和转换音乐的流派风格。

主权项:1.一种基于扩散模型的音乐音色风格转换方法,其特征在于,包括以下步骤:构建潜在扩散模型,获取输入文本信息,将所述文本信息进行标记化及参数化处理,获取与风格音乐对应的嵌入向量;在所述潜在扩散模型中引入交叉注意力机制的学习方法,获取风格音乐的关键信息,并给出学习的对应文本嵌入向量,对所述潜在扩散模型进行训练,输出符合预设标准的潜在扩散模型;获取目标内容音乐,通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,生成以输入文本为条件的编码后的新音乐;以输入的文本信息为条件,通过对随机噪声进行去噪处理,得到一系列潜码,并最终提供与风格音乐相对应的潜码;根据所述潜码作为输入进行潜在扩散模型的随机反演,根据加噪后的风格音乐潜码进行潜在扩散模型的重参数处理;通过潜在扩散模型将随机噪声添加至所述目标内容音乐,并利用潜在扩散模型的反向过程进行去噪,具体为:在潜在扩散模型的前向过程中利用余弦式噪声策略将随机噪声逐步添加至目标内容音乐中,随机选择扩散步数,获取目标内容音乐加噪过程中各步骤噪声对应的均值及方差;当所述均值及方差符合预设真值标准时,完成目标内容音乐的加噪过程,将加噪后的目标内容音乐导入UNet网络,进行解码去噪,生成目标内容音乐与风格音乐的合成结果。

全文数据:

权利要求:

百度查询: 广州市车厘子电子科技有限公司 基于扩散模型的音乐音色风格转换方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。