买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:完美世界(北京)软件科技发展有限公司
摘要:本申请涉及一种语音生成模型的训练方法、语音生成方法及相关装置,该方法包括:获取多个训练样本,其中,每个训练样本包括文本样本和音频样本;获取各训练样本中文本样本对应的音素序列和音频样本对应的音频特征分布参数;依次将各训练样本对应的音素序列和音频特征分布参数输入至待训练模型中进行训练,得到各训练样本对应的预测音素持续时长和预测音频特征分布参数,在预测音素持续时长和预测音频特征分布参数满足预设条件的情况下,对待训练模型停止训练,得到语音生成模型。这样,无需先对新说话对象的音频进行训练后再生成语音,因而降低了新说话对象语音扩展的成本和时间周期,使得新说话对象的语音扩展实现更加简单,应用场景更广。
主权项:1.一种语音生成模型的训练方法,其特征在于,所述方法包括:获取多个训练样本,其中,每个所述训练样本包括文本样本和音频样本,所述音频样本是任一训练对象基于所述文本样本产生得到的;获取各训练样本中文本样本对应的音素序列和音频样本对应的音频特征分布参数;依次将各训练样本对应的音素序列和音频特征分布参数输入至待训练模型中进行训练,得到各训练样本对应的预测音素持续时长和预测音频特征分布参数,在所述预测音素持续时长和所述预测音频特征分布参数满足预设条件的情况下,对所述待训练模型停止训练,得到语音生成模型;其中,所述预测音素持续时长和所述预测音频特征分布参数用于表征所述待训练模型学习到的所述训练对象的声音特征。
全文数据:
权利要求:
百度查询: 完美世界(北京)软件科技发展有限公司 语音生成模型的训练方法、语音生成方法及相关装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。