京东科技信息技术有限公司宋伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉京东科技信息技术有限公司申请的专利歌声合成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115019767B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210846439.0,技术领域涉及:G10L13/02;该发明授权歌声合成方法及装置是由宋伟;张炜;张政臣;吴友政设计研发完成,并于2022-07-19向国家知识产权局提交的专利申请。
本歌声合成方法及装置在说明书摘要公布了:本发明提供一种歌声合成方法及装置,该方法包括:获取目标歌曲的声谱数据;提取其中的音素、音高及音频;应用编码器对音素进行处理,获得隐式谱表征向量;应用预测器基于隐式谱表征向量及音高预测声学参数;提取音频中的音高轨迹并分解,获得目标歌曲中每个音节对应的颤音特征;基于颤音特征,预测每个音节出现颤音的概率;当音节出现颤音的概率满足预设的阈值时,合成音节对应的模拟颤音,并对音节进行标记;将声谱数据、声学参数及已标注的音节对应的模拟颤音输入至预设的声音模型,生成目标歌曲对应的合成歌声。应用本发明提供的方法,通过隐式谱表征向量提升歌声韵律的同时,加入颤音提高歌声的表现力,使得合成的歌声更加自然。
本发明授权歌声合成方法及装置在权利要求书中公布了:1.一种歌声合成方法,其特征在于,包括: 获取目标歌曲的声谱数据; 提取所述声谱数据中所述目标歌曲对应的音素、音高及音频; 应用预设的编码器对所述音素进行处理,获得所述目标歌曲对应的隐式谱表征向量,所述隐式谱表征向量用于表征所述目标歌曲的能量信息; 应用预设的预测器基于所述隐式谱表征向量及所述音高,预测所述目标歌曲对应的声学参数;所述声学参数包括梅尔广义倒谱、带非周期信号和音高;所述带非周期信号指的是语音信号和信号的非周期分量之间的功率比; 提取所述音频中的音高轨迹,并分解所述音高轨迹,获得所述目标歌曲中每个音节对应的颤音特征; 获取颤音相似性标注网络基于每个所述音节对应的颤音特征,预测的每个所述音节出现颤音的概率; 当任意的音节出现颤音的概率满足预设的阈值时,合成所述音节对应的模拟颤音,并对所述音节进行标记; 将所述声谱数据、所述声学参数及各个已标注的音节对应的模拟颤音输入至预设的声音模型,生成所述目标歌曲对应的合成歌声; 其中,所述合成所述音节对应的模拟颤音,包括: 选取所述音节对应的颤音特征中的振幅、频率和相位; 应用预设的颤音模拟算法对所述振幅、频率、相位以及所述音节出现颤音的概率进行计算,生成所述音节对应的模拟颤音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人京东科技信息技术有限公司,其通讯地址为:100000 北京市北京经济技术开发区科创十一街18号院2号楼6层601;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励