一种基于RDDM的高质量说话人脸视频生成方法及系统

导航：龙图腾网> 最新专利技术> 一种基于RDDM的高质量说话人脸视频生成方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：湘江实验室

摘要：本发明提供了一种基于RDDM的高质量说话人脸视频生成方法及系统，包括以下步骤：获取人脸参考图像、风格参考视频和音频片段；本发明通过获取人脸参考图像以及对应的风格参考视频和音频片段，对风格参考视频以及音频片段分别进行相应处理，得到对应的风格特征以及语音特征；然后将风格特征和语音特征输入到基于RDDM的解码器中，进行正向扩散和反向扩散得到预测的3D面部运动，使重建出的3D面部运动数据清晰无残差，准确的呈现出所需的面部表情细节和运动轨迹，最后，再通过图像渲染器将3D面部运动和参考图像作为输入来生成说话的面部，提高了说话人脸视频的生成质量和视觉效果。

主权项：1.一种基于RDDM的高质量说话人脸视频生成方法，其特征在于，包括以下步骤：S1、获取人脸参考图像、风格参考视频和音频片段；S2、将风格参考视频使用Deep3DFace进行处理得到表情系数，并根据表情系数利用风格编码器获得风格特征；S3、通过语音识别工具对音频片段提取音素，并根据音素标签利用音频编码器获得语音特征；S4、将风格特征和语音特征输入到基于RDDM的解码器中，进行正向和反向扩散，得到预测的3D面部运动；S5、通过图像渲染器将3D面部运动和人脸参考图像作为输入，生成高质量的说话人脸；其中，正向扩散是向初始状态通过添加高斯噪声逐步引入面部扭曲和细节模糊的残差，到一个噪声数据；反向扩散是从带有残差的噪声数据逐步去残差和噪声，逐步恢复面部的清晰度，同时引入输入的特征信息，使重建出的3D面部运动数据清晰无残差，呈现出所需的面部表情细节和运动轨迹。

全文数据：

权利要求：

百度查询：湘江实验室一种基于RDDM的高质量说话人脸视频生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种矿用泡沫抑尘设备的喷头组件

下一篇：一种防位移的接线插拔式继电器

相关技术

一种矿用泡沫抑尘设备的喷头组件

一种防位移的接线插拔式继电器

一种果树苗木移栽机

一种蔬菜种植用培育防虫装置

一种T型钢生产用垂直检验装置

一种混凝土试块自动投料密实装置

一种螺杆空压机的自动润滑装置

一种水利巡河安全警报组件

一种四合一冲锋衣

一种建筑工程基坑监测装置

一种新能源车辆防爆充电桩

一种建筑工程施工用提升装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于RDDM的高质量说话人脸视频生成方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务