广州佰锐网络科技有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州佰锐网络科技有限公司申请的专利一种基于深度学习的多语言TTS实时合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120580987B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510844724.2,技术领域涉及:G10L13/08;该发明授权一种基于深度学习的多语言TTS实时合成方法是由请求不公布姓名设计研发完成,并于2025-06-23向国家知识产权局提交的专利申请。
本一种基于深度学习的多语言TTS实时合成方法在说明书摘要公布了:本发明公开了一种基于深度学习的多语言TTS实时合成方法。该方法通过深度神经网络模型,实现多语言文本到语音的高质量实时转换。首先,构建多语言声学特征库和发音规则库,采用端到端神经网络架构提取文本语义特征。然后,利用改进的注意力机制,实现语音韵律和发音的精准合成,保证多语言发音的自然度和连贯性。同时,设计轻量级推理引擎,优化计算资源分配,满足实时合成需求。与传统TTS方法相比,本发明显著提升了多语言语音合成的流畅度和自然度,大幅降低了计算延迟,为智能语音交互和多语言内容生产提供了高效可靠的技术支持。
本发明授权一种基于深度学习的多语言TTS实时合成方法在权利要求书中公布了:1.一种基于深度学习的多语言TTS实时合成方法,其特征在于,所述方法包括:获取多语言文本输入,通过预训练语言模型进行词嵌入编码,采用多头注意力机制提取文本序列的语义特征,基于语言标识符激活对应语言的特征提取分支,生成语义特征向量;通过循环神经网络对所述语义特征向量进行序列建模,采用三重门控机制控制信息流动,基于语调变化调整韵律控制参数,生成序列编码结果,其中通过长短期记忆网络对所述语义特征向量进行序列建模,计算输入门控制值,生成候选记忆单元状态;基于所述候选记忆单元状态和前一时刻记忆单元状态,计算遗忘门控制值,与前一时刻记忆单元状态相乘,生成当前时刻记忆单元状态;通过输出门权重矩阵处理所述语义特征向量,生成输出门控制值,基于基频分量调整韵律控制参数,生成隐藏状态向量;通过注意力权重分配机制对所述序列编码结果进行加权处理,采用软注意力计算方法确定关键韵律节点,生成关键时间点分布;根据所述关键时间点分布,通过声学建模网络生成梅尔频谱特征,提取局部声学模式,基于语言切换边界调整声学参数,生成频谱生成结果;采用轻量化声码器对所述频谱生成结果进行时域信号转换,生成时域语音波形数据;通过特征融合模块对所述时域语音波形数据进行后处理,生成多语言语音合成输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州佰锐网络科技有限公司,其通讯地址为:510630 广东省广州市天河区科韵路16号自编第3栋701;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励