基于扩散模型的音乐音色风格转换方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：广州市车厘子电子科技有限公司

摘要：本发明公开了基于扩散模型的音乐音色风格转换方法及系统，包括：构建潜在扩散模型，获取输入文本信息进行标记化及参数化处理，获取与风格音乐对应的嵌入向量；在潜在扩散模型中引入交叉注意力机制的学习方法，获取风格音乐的关键信息，并给出学习的对应文本嵌入向量，通过训练输出符合预设标准的潜在扩散模型；获取目标内容音乐，通过潜在扩散模型将随机噪声添加至所述目标内容音乐，并利用潜在扩散模型的反向过程进行去噪，生成以输入文本为条件的编码后的新音乐。本发使用潜在扩散模型来进行音乐音色风格迁移，直接从风格音乐中学习艺术风格，然后指导合成，能够高效、准确地学习音乐中的关键信息，从而捕捉和转换音乐的流派风格。

主权项：1.一种基于扩散模型的音乐音色风格转换方法，其特征在于，包括以下步骤：构建潜在扩散模型，获取输入文本信息，将所述文本信息进行标记化及参数化处理，获取与风格音乐对应的嵌入向量；在所述潜在扩散模型中引入交叉注意力机制的学习方法，获取风格音乐的关键信息，并给出学习的对应文本嵌入向量，对所述潜在扩散模型进行训练，输出符合预设标准的潜在扩散模型；获取目标内容音乐，通过潜在扩散模型将随机噪声添加至所述目标内容音乐，并利用潜在扩散模型的反向过程进行去噪，生成以输入文本为条件的编码后的新音乐；以输入的文本信息为条件，通过对随机噪声进行去噪处理，得到一系列潜码，并最终提供与风格音乐相对应的潜码；根据所述潜码作为输入进行潜在扩散模型的随机反演，根据加噪后的风格音乐潜码进行潜在扩散模型的重参数处理；通过潜在扩散模型将随机噪声添加至所述目标内容音乐，并利用潜在扩散模型的反向过程进行去噪，具体为：在潜在扩散模型的前向过程中利用余弦式噪声策略将随机噪声逐步添加至目标内容音乐中，随机选择扩散步数，获取目标内容音乐加噪过程中各步骤噪声对应的均值及方差；当所述均值及方差符合预设真值标准时，完成目标内容音乐的加噪过程，将加噪后的目标内容音乐导入UNet网络，进行解码去噪，生成目标内容音乐与风格音乐的合成结果。

全文数据：

权利要求：

百度查询：广州市车厘子电子科技有限公司基于扩散模型的音乐音色风格转换方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种红松生长影响因素获取系统

下一篇：一种建筑工程结构缝隙灌浆装置

相关技术

一种红松生长影响因素获取系统

一种建筑工程结构缝隙灌浆装置

半固态电解质膜及其制备方法、二次电池

一种公路深层病害双组分高聚物抽拔注浆加固装置及方法

一种可自动充电的分体式移动充电桩及其方法

BC电池激光划线设备

一种除湿机热源自动切换控制方法及装置

一种带有光路定向机构的车载顶灯

一种3D打印仰卧式腰臀穴位点治疗系统及数据采集方法

一种高取代氟化壳聚糖及其制备方法

一种基于感知线程束类型的GPGPU性能优化方法

钢包上水口拆卸装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于扩散模型的音乐音色风格转换方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务