首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种拟人化的语音合成方法、装置及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:暗物智能科技(广州)有限公司

摘要:本发明公开了一种拟人化的语音合成方法、装置及可读存储介质,包括:首先,对待处理文本进行特征编码,获取包含语义和语境信息的文本编码特征。接着,通过语音风格预测得到对应的语音风格信息,并提取其风格特征隐变量。将文本编码特征与风格特征隐变量融合,形成融合语音特征。然后,将这些特征输入预设的特征解码器,获得语音解码特征向量。进一步地,结合目标说话用户的身份标识进行特征转化,得到音频信号特征。最后,利用声码器处理这些音频信号特征,生成具有拟人化特色的目标合成语音。如此设计,能够显著提高语音合成的自然度和个性化表现,为用户提供更加逼真的语音交互体验。

主权项:1.一种拟人化的语音合成方法,其特征在于,包括:获取待处理文本,对所述待处理文本进行特征编码操作,得到所述待处理文本对应的文本编码特征,所述文本编码特征包括文本语义信息和文本语境信息;对所述文本编码特征进行语音风格预测,得到所述文本编码特征对应的语音风格信息;提取所述语音风格信息的风格特征隐变量,并将所述文本编码特征和所述风格特征隐变量进行融合,得到融合语音特征;将所述融合语音特征输入预设特征解码器,得到所述融合语音特征对应的语音解码特征向量;将所述语音解码特征向量和目标说话用户的身份标识进行特征转化,得到音频信号特征;通过声码器对所述音频信号特征进行处理,得到目标拟人化合成语音;所述风格特征隐变量通过以下方式学习,包括:获取经过正则化流模型得到的样本风格特征隐变量;将所述样本风格特征隐变量输入语言现象预测器进行处理,得到所述样本风格特征隐变量的第一特征表示;将语言现象标签输入语言现象编码器进行处理,得到所述语言现象标签的第二特征表示;根据所述第一特征表示和所述第二特征表示的误差进行损失计算,以完成针对所述风格特征隐变量的学习。

全文数据:

权利要求:

百度查询: 暗物智能科技(广州)有限公司 一种拟人化的语音合成方法、装置及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术