腾讯美国有限责任公司卢恒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯美国有限责任公司申请的专利一种根据输入生成语音和视频信息的方法、设备、装置和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114041183B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080030508.X,技术领域涉及:G10L13/08;该发明授权一种根据输入生成语音和视频信息的方法、设备、装置和介质是由卢恒;俞承柱;俞栋设计研发完成,并于2020-08-06向国家知识产权局提交的专利申请。
本一种根据输入生成语音和视频信息的方法、设备、装置和介质在说明书摘要公布了:一种根据输入生成语音和视频信息的方法、设备、装置和介质,包括接收包括文本构成要素序列的文本输入。使用持续时间模型确定文本构成要素的各个时间性持续时间。基于持续时间模型生成频谱图帧。基于频谱图帧生成音频波形。基于音频波形生成视频信息。音频波形与对应视频一起被提供作为输出。
本发明授权一种根据输入生成语音和视频信息的方法、设备、装置和介质在权利要求书中公布了:1.一种根据输入生成语音和视频信息的方法,其特征在于,所述方法包括: 由设备接收包括文本构成要素序列的文本输入,所述文本构成要素为字符; 由所述设备并使用持续时间模型来确定所述文本构成要素的各个时间性持续时间; 由所述设备基于所述文本构成要素序列生成第一频谱组; 由所述设备基于所述第一频谱组和所述文本构成要素序列的所述各个时间性持续时间生成第二频谱组,所述第二频谱组为基于对应于频谱的基本文本构成要素的各个时间性持续时间通过复制第一频谱组中的各个频谱生成的; 由所述设备基于所述第二频谱组生成频谱图帧; 由所述设备基于所述频谱图帧生成音频波形; 由所述设备生成与所述音频波形相对应的视频信息;以及 由所述设备基于所述视频信息提供所述音频波形和对应视频作为所述设备的输出; 其中,所述文本输入通过以下获得: 接收包括对应输入音频波形的输入视频作为输入; 由所述设备生成与所述输入音频波形相对应的输入视频信息; 由所述设备基于所述输入音频波形生成输入频谱图帧; 由所述设备基于所述输入频谱图帧生成第一输入频谱组; 由所述设备基于所述第一输入频谱组生成第二输入频谱组;以及 由所述设备并使用所述持续时间模型确定所述文本输入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯美国有限责任公司,其通讯地址为:美国加利福尼亚州帕洛阿尔托公园大道2747号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。