恭喜腾讯美国有限责任公司俞承柱获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯美国有限责任公司申请的专利用于文本到语音转换分析的持续时间知悉网络获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113711305B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080028696.2,技术领域涉及:G10L13/02;该发明授权用于文本到语音转换分析的持续时间知悉网络是由俞承柱;卢恒;俞栋设计研发完成,并于2020-03-05向国家知识产权局提交的专利申请。
本用于文本到语音转换分析的持续时间知悉网络在说明书摘要公布了:一种方法和装置,包括:接收包括文本分量的序列的文本输入。使用持续时间模型来确定文本分量的相应持续时间。基于文本分量的序列来生成第一语谱集。基于第一语谱集和文本分量的序列的相应持续时间来生成第二语谱集。基于第二语谱集来生成语谱图帧。基于语谱图帧来生成音频波形。提供音频波形作为输出。
本发明授权用于文本到语音转换分析的持续时间知悉网络在权利要求书中公布了:1.一种文本到语音转换分析的方法,包括: 通过设备接收包括文本分量的序列的文本输入;所述文本分量是音素和字符中的至少一个; 通过所述设备并使用持续时间模型来确定所述文本分量的相应持续时间;所述持续时间模型是通过使已知持续期的语谱图帧和文本分量的序列对齐来进行训练所得到的模型; 通过所述设备基于所述文本分量的序列,通过CBHG模块来生成第一语谱集;所述CBHG模块包括一堆一维卷积滤波器、一组公路网、双向选通循环单元、循环神经网络和或其他组件; 通过所述设备基于所述第一语谱集和所述文本分量的相应持续时间,通过复制所述第一语谱集中的语谱来生成第二语谱集; 通过所述设备基于所述第二语谱集的相应组成语谱分量生成语谱图帧;所述语谱图帧与所述文本输入的预期音频输出对齐;所述文本输入的长度小于所述语谱图帧的长度;来自所述文本输入的单个字符或音素用于生成语谱图帧中的多个帧; 通过所述设备基于所述语谱图帧来生成音频波形;以及 通过所述设备提供所述音频波形作为输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯美国有限责任公司,其通讯地址为:美国加利福尼亚州帕洛阿尔托公园大道2747号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。