数字人口型的自动对齐方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华南理工大学

摘要：本发明公开了一种数字人口型的自动对齐方法，包括以下步骤：获取人物说话视频和驱动音频，分别对人物说话视频和驱动音频进行预处理，得到人物人脸图像序列和语音音频序列；根据人脸图像序列初始化参考帧，获得参考人脸序列，掩膜人物半脸，掩膜后人脸与参考人脸拼接得到拼接图像序列；将拼接图像序列输入图像编码器，得到人脸图像特征向量，将语音音频序列输入音频编码器，得到音频语义特征向量；对人物的人脸图像特征向量和音频语义特征向量进行拼接融合，将拼接融合特征输入生成器，生成人物口型同步视频；根据评估指标和约束条件，评估口型同步视频质量，使用约束优化算法对参考人脸序列进行迭代优化，直至生成最佳口型同步视频。

主权项：1.一种数字人口型的自动对齐方法，其特征在于，包括以下步骤：S1.获取人物说话视频和驱动音频，分别对人物说话视频和驱动音频进行预处理，得到人物人脸图像序列和语音音频序列；S2.根据人脸图像序列初始化参考帧，获得参考人脸序列，掩膜人物半脸，掩膜后人脸与参考人脸拼接得到拼接图像序列；S3.将拼接图像序列输入图像编码器，得到人脸图像特征向量，将语音音频序列输入音频编码器，得到音频语义特征向量；S4.对人物的人脸图像特征向量和音频语义特征向量进行拼接融合，将拼接融合特征输入生成器，生成人物口型同步视频；S5.根据评估指标和约束条件，评估口型同步视频质量，使用约束优化算法对参考人脸序列进行迭代优化，直至生成最佳口型同步视频。

全文数据：

权利要求：

百度查询：华南理工大学数字人口型的自动对齐方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：用于增加铜或铜合金表面与有机层之间的粘附强度的方法

下一篇：基于深度强化学习的安全电力调度方法

相关技术

用于增加铜或铜合金表面与有机层之间的粘附强度的方法

基于深度强化学习的安全电力调度方法

交通艇

一种电力设备故障恢复路径规划方法及系统

遥感影像响应值模型的获取方法及中波红外遥感载荷的在轨绝对辐射定标方法

一种聚乳酸基发泡材料及其制备方法

密闭自洁储备补偿供水设备、系统及使用方法

一种双充无线充电发射器

一种可变形更换照射模式的智慧路灯

锅炉烟气全负荷脱硝装置

一种微波液氮协同真三轴孔内冷热冲击试验装置及方法

一种基于视觉的车辆跑偏检测方法及系统

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

数字人口型的自动对齐方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务