一种基于姿势对抗网络的人脸视频生成方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华侨大学

摘要：本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统，涉及图像处理技术领域，方法包括：构建人脸视频生成模型，包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器，所述人脸视频生成模型接收人脸图像和语音音频，生成人脸说话视频；获取训练数据集并对人脸视频生成模型进行预训练；构建唇型同步判别器作为判别器，对预训练人脸视频生成模型进行生成对抗训练；利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模，并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度，同时兼顾视频的逼真度，使得其更加真实、自然，从而为各种应用场景提供了更多的灵活性。

主权项：1.一种基于姿势对抗网络的人脸视频生成方法，其特征在于，包括：构建人脸视频生成模型，包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码生成模块，所述人脸视频生成模型接收人脸图像和语音音频，图像编码器对人脸图像提取图像特征，音频编码器对语音音频提取语音特征，头部运动预测模块结合人脸图像和语音音频预测头部姿势序列，姿势编码器对头部姿势序列提取姿势特征；解码生成模块接收图像特征、语音特征、头部姿势序列和人脸图像，生成人脸说话视频；获取具有正面人脸的人脸说话视频并进行预处理，获得人脸图像和语音音频作为训练数据集；利用训练数据集对人脸视频生成模型进行预训练，获得预训练人脸视频生成模型；构建唇型同步判别器作为判别器，对预训练人脸视频生成模型进行生成对抗训练，获得训练好的人脸视频生成模型；利用训练好的人脸视频生成模型，根据输入的人脸图像和语音音频生成人脸说话视频。

全文数据：

权利要求：

百度查询：华侨大学一种基于姿势对抗网络的人脸视频生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可拼装的立体贺卡

下一篇：一种防晃茶杯托盘

相关技术

一种可拼装的立体贺卡

一种防晃茶杯托盘

一种相机支架

一种框架式前防撞系统

一种新型环氧密封直流接触器

片烟运输线用电梯按键装置

一种COB灯条的散热结构

毛刷组件及刷蛋液机

一种便捷的数据故障检测记录仪

一种管状带式输送机防偏转装置

一种大理石草酸抛光磨块

一种电解槽中心定位装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于姿势对抗网络的人脸视频生成方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务