一种基于改进Tacotron2模型的中文音节语音合成方法与系统

导航：龙图腾网> 最新专利技术> 一种基于改进Tacotron2模型的中文音节语音合成方法与系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种基于改进Tacotron2模型的中文音节语音合成方法与系统，涉及语音合成技术领域，方法包括如下步骤：构建并训练中文音节语音合成模型；将待合成的音素音频输入训练好的中文音节语音合成模型以实现语音合成；所述中文音节语音合成模型包括：音节音频初始嵌入模块，编码模块、注意力感知模块、预网络、注意力模块、解码模块、后置网络层和线性频谱转换层。本发明可利用声韵母音频合成未有汉字载体的中文音节发音的音频，通过这种方法，即使某些发音没有对应的汉字也能够通过组合声母、韵母和声调来合成相应的音节，这不仅能够丰富中文语音合成的技术和应用，还能够为语言学研究提供新的工具和视角。

主权项：1.一种基于改进Tacotron2模型的中文音节语音合成方法，其特征在于，包括如下步骤：构建基于改进Tacotron2模型的中文音节语音合成模型；采用包括音素音频和音节音频的数据集训练中文音节语音合成模型；将待合成的音素音频输入训练好的中文音节语音合成模型以实现语音合成；所述中文音节语音合成模型包括：音节音频初始嵌入模块，接收音节音频，输出音节音频初始嵌入矩阵用于训练中文音节语音合成模型；编码模块，接收音素音频，输出音素音频初始嵌入矩阵和编码隐藏状态；注意力感知模块，接收音素音频初始嵌入矩阵、编码隐藏状态、预网络序列以及解码隐藏状态，计算并输出上下文向量和注意力隐藏状态，其中，音素音频初始嵌入矩阵用于控制中文音节语音合成模型何时停止预测；预网络，接收上一个时间步的解码隐藏状态，输出预网络序列到注意力感知模块；解码模块，接收当前时间步的注意力隐藏状态，计算出解码隐藏状态，并利用线性投影层将解码隐藏状态转换为学习梅尔频谱特征；后置网络层，接收学习梅尔频谱特征，输出梅尔频谱特征矩阵；线性频谱转换层，接收梅尔谱特征矩阵，输出语音波形。

全文数据：

权利要求：

百度查询：华侨大学一种基于改进Tacotron2模型的中文音节语音合成方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于阵列式超声的动弹模量和泊松比的自动检测方法

下一篇：一种基于RTDETR的半监督学习的电力设备状态识别方法及系统

相关技术

一种基于阵列式超声的动弹模量和泊松比的自动检测方法

一种基于RTDETR的半监督学习的电力设备状态识别方法及系统

柴油发电机并网管控半物理测试系统与方法

一种任务执行方法、装置、存储介质及电子设备

一种业务的分析方法及其装置

微通道翅片插槽成型方法

一种自动化拣选耗材的仓储配送装置及方法

一种自动化组装设备

HSP90AA1在BCR::ABL扩增型CML耐药中的作用及治疗应用

一种无线供电压力实时测量的舞蹈鞋及方法、生产方法

基于改进物理信息神经网络的减震装置优化方法及系统

基于车辆的控制方法、装置、设备

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于改进Tacotron2模型的中文音节语音合成方法与系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务