北京捷通华声科技股份有限公司李睿端获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京捷通华声科技股份有限公司申请的专利一种语音合成方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119943025B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411882752.5,技术领域涉及:G10L13/027;该发明授权一种语音合成方法、装置及电子设备是由李睿端;李健;陈明;武卫东设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本一种语音合成方法、装置及电子设备在说明书摘要公布了:本发明实施例提供了一种语音合成方法、装置及电子设备,涉及语音合成技术领域。本方法包括:对目标文本进行处理,得到目标音素信息;将目标音素信息和目标语种信息输入语音合成模型,得到目标频谱特征;基于目标频谱特征得到目标语种的语音信息;语音合成模型至少包括:用于处理多个语种的文本转换任务,生成与语种无关的抽象特征表示的共享编码器、用于增强多个语种各自的特性的多个语种各自对应的中间层,以及,用于分别学习多个语种各自对应的发音特征的多个语种各自对应的解码器。通过本发明实施例的语音合成方法,能够提升数据量小的语种对应的语音合成精度。
本发明授权一种语音合成方法、装置及电子设备在权利要求书中公布了:1.一种语音合成方法,其特征在于,所述方法包括: 对目标文本进行处理,得到目标音素信息,所述目标文本包括:一个或多个待处理文本; 将所述目标音素信息和目标语种信息输入语音合成模型,得到所述目标文本对应的目标频谱特征,所述目标语种信息为所述目标文本对应的一个或多个语种信息; 基于所述目标频谱特征得到目标语种的语音信息; 其中,所述语音合成模型至少包括:共享编码器、多个语种各自对应的中间层,以及,多个语种各自对应的解码器;所述共享编码器用于处理多个语种的文本转换任务,生成与语种无关的抽象特征表示;所述多个语种各自对应的中间层分别用于增强多个语种各自的特性;所述多个语种各自对应的解码器用于分别学习多个语种各自对应的发音特征; 将所述目标音素信息和目标语种信息输入语音合成模型,得到所述目标文本对应的目标频谱特征,包括: 将所述目标音素信息和所述目标语种信息输入至所述共享编码器,得到目标通用信息; 将所述目标通用信息和所述目标语种信息输入至所述目标语种对应的中间层,得到中间特征; 至少将所述中间特征输入至所述目标语种对应的解码器,得到所述目标文本对应的目标频谱特征; 至少将所述中间特征输入至所述目标语种对应的解码器,得到所述目标文本对应的目标频谱特征,包括: 将所述中间特征、所述目标音素信息以及所述目标音素信息对应的条件化信息进行拼接,得到第一拼接特征; 将所述第一拼接特征输入至所述目标语种对应的解码器,得到所述目标文本对应的目标频谱特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京捷通华声科技股份有限公司,其通讯地址为:100193 北京市海淀区东北旺西路8号9号楼3层2区318;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励