首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种音脸同步视频生成方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州虎牙科技有限公司

摘要:本发明提供的一种音脸同步视频生成方法、装置、电子设备及存储介质,所述方法通过将视频数据分离出用于训练的所述音频数据,以及用于对照的所述视频图像数据,并视频图像数据中获取原始数据,通过所述音频数据获取预测人脸的顶点信息,根据所述原始信息和所述预测脸部的顶点信息渲染预测3D对象脸部,在训练的过程中将所述预测3D对象脸部与原始脸部进行形状损失计算。与现有技术相比,渲染得到的所述预测3D对象脸部直观地包含了所述预测脸部的顶点的形状、位置和颜色,本发明通过计算所述形状损失,能够提高所述脸部重构模型捕捉微妙的表情变化,进一步提高预测的精度以及生成视频的同步率。

主权项:1.一种音脸同步视频生成方法,其特征在于,所述生成方法包括:获取对象脸部的视频数据,根据所述视频数据获取对应的视频图像数据和音频数据;根据所述视频图像数据获取所述对象原始脸部的原始信息;构建脸部重建模型,根据所述视频图像数据和音频数据对所述脸部重建模型进行训练;所述训练包括:将所述音频数据输入所述脸部重建模型进行预测,得到预测脸部的顶点信息;根据所述视频图像数据的所述原始信息和所述预测脸部的顶点信息渲染预测3D对象脸部,计算所述预测3D对象脸部与所述原始脸部的形状损失;根据计算的损失优化所述脸部重建模型的参数,得到训练好的所述脸部重建模型;获取目标对象的音频数据,根据训练好的所述脸部重构模型和所述目标对象的音频数据获取所述目标对象的脸部视频。

全文数据:

权利要求:

百度查询: 广州虎牙科技有限公司 一种音脸同步视频生成方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。