首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

显示设备及基于图像迁移的方言语音合成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:海信电子科技(武汉)有限公司

摘要:本申请一些实施例提供一种显示设备及基于图像迁移的方言语音合成方法,所述方法可以获取用户输入的语音数据,并根据语音数据生成语音频谱图;在发音词典中查询语音数据对应的方言音素标注,其中,发音词典中包括普通话的字级别标注与方言的音素级别标注的映射关系;以及将语音频谱图和方言音素标注输入至迁移模型中,以生成方言频谱图;并将方言频谱图输入至音频合成模型中,以生成方言音频波形,再基于方言音频波形生成方言音频。所述方法可以将用户输入的语音数据生成语音频谱图,并利用图像迁移将语音频谱图转换为方言频谱图,进而生成方言音频,所述方法能够在方言音频中保留用户的声音属性,提高方言音频的自然度和表现力。

主权项:1.一种显示设备,其特征在于,包括:显示器,被配置为显示用户界面;音频采集器,被配置为采集用户输入的语音数据;控制器,被配置为:获取所述语音数据,并根据所述语音数据生成语音频谱图,所述语音频谱图用于表征所述语音数据的时间、频率和频谱强度之间的映射关系;在发音词典中查询所述语音数据对应的方言音素标注,所述发音词典中包括普通话的字级别标注与方言的音素级别标注的映射关系;将所述语音频谱图和所述方言音素标注输入至迁移模型中,以生成方言频谱图,所述迁移模型为执行图像迁移任务的深度学习模型;将所述方言频谱图输入至音频合成模型中,以生成方言音频波形,所述音频合成模型为根据音频信号生成音频波形的深度学习模型,所述方言音频波形用于表征方言音频的频率和相位之间的对应关系;基于所述方言音频波形生成方言音频。

全文数据:

权利要求:

百度查询: 海信电子科技(武汉)有限公司 显示设备及基于图像迁移的方言语音合成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。