一种轻量化个性人脸视觉配音方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：合肥工业大学

摘要：本发明涉及视觉配音技术领域，公开了一种轻量化个性人脸视觉配音方法，包括：将通用数据集的视频文件中的音频分离，得到音频文件；对音频文件进行语音特征提取，得到驱动音频；对视频文件进行面部特征图像提取和图像帧提取，分别得到面部特征图像和图像帧；构建基础视觉配音模型；构建损失函数一对基础视觉配音模型进行训练；对基础视觉配音模型进行剪枝和量化，得到轻量视觉配音模型；构建个性化数据集，通过个性化数据集以及损失函数二对轻量视觉配音模型进行训练；将视频文件以及用户的个人音频输入到轻量视觉配音模型，生成唇形能够匹配所述个人音频的合成视频。减小了模型的规模，提高了运行效率。

主权项：1.一种轻量化个性人脸视觉配音方法，包括以下步骤：步骤一，构建通用数据集并进行数据处理：将通用数据集的视频文件中的音频分离，得到音频文件；对音频文件进行语音特征提取，得到驱动音频；对视频文件进行面部特征图像提取和图像帧提取，分别得到面部特征图像和图像帧；步骤二，构建基础视觉配音模型：基础视觉配音模型包括形变网络和复原网络；形变网络的输入包括驱动音频、源人脸图像和参考人脸图像，其中，源人脸图像为所述图像帧经过人脸检测并加入嘴部掩码后得到的图像，参考人脸图像为所述面部特征图像；形变网络对驱动音频进行编码，得到音频编码特征；形变网络使用人脸特征编码器分别对源人脸图像和参考人脸图像进行特征提取，将得到的源人脸图像特征和参考人脸图像特征沿着特征通道堆叠并进行对齐，得到对齐特征；通过对和进行堆叠，得到空间形变系数；根据空间形变系数，对参考人脸图像特征进行自适应仿射变换的空间形变，得到形变特征图；将源人脸图像特征和形变特征图沿着特征通道堆叠后，输入到复原网络的解码器中，输出合成视频帧；将合成视频帧输入到判别器进行对抗训练，判别器输出用于表示合成视频帧是否真实的标签；构建损失函数一对基础视觉配音模型进行训练，损失函数一包括感知损失函数、生成对抗网络损失函数，以及同步损失函数：；为的权重；步骤三，对基础视觉配音模型进行剪枝和量化，得到轻量视觉配音模型：所述人脸特征编码器包括多个卷积层；对基础视觉配音模型进行剪枝时，为人脸特征编码器的每个卷积层引入结构化的掩码，在基础视觉配音模型前向传播过程中，通过按元素乘法将每个卷积层的权重矩阵与相应的掩码相乘，实现对每个卷积层的权重进行选择性应用；所述解码器包括多个卷积层；对基础视觉配音模型进行量化时，对解码器的卷积层的权重以及激活值进行整数量化处理；步骤四，构建符合用户偏好的个性化数据集，通过个性化数据集以及损失函数二对轻量视觉配音模型进行训练；；为用于推动掩码进行剪枝的稀疏性损失，为用于调整稀疏性损失的超参数；步骤五，将视频文件以及用户的个人音频输入到轻量视觉配音模型，生成唇形能够匹配所述个人音频的合成视频。

全文数据：

权利要求：

百度查询：合肥工业大学一种轻量化个性人脸视觉配音方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种低硬度彩色天然橡胶材料及其制备方法

下一篇：高端计算机处理器用散热器及其制造方法

相关技术

一种低硬度彩色天然橡胶材料及其制备方法

高端计算机处理器用散热器及其制造方法

一种炉头自动生产线及其工艺

一种基于机场场面空地互联的虚拟交通灯系统

叔丁醇的制造方法

一种沙门氏菌预富集培养基及其制备方法和在即食调味品中的应用

一种用于实现低速清扫车自动行驶系统的方法

用于对数据中心的PUE值的预测方法及系统

情感分类模型训练方法、系统、情感分类方法及系统

一种热网加热器换热管泄漏在线定位系统及方法

一种石质文物保护用高耐久透明降温自清洁涂层的制备方法

电信网元实时处理方法、装置、设备、介质及程序产品

视觉相关技术

全自视觉贴膜机_东莞市德尚精密机械设备有限公司_202420130331.6

显示面板的视觉检测方法_江西蓝图智能制造科技有限公司_202411032101.7

基于机器视觉的印刷设备_扬州东兴印刷包装有限公司_202411178558.9

3D视觉残留风扇_溙奕(江西)电子科技有限公司_202420653086.7

一种视觉传达设计平台_安徽财经大学_202420615243.5

采用视觉解析技术的排量监测方法_大连大开污水处理有限公司_202411159034.5

基于视觉算法的弱苗识别剔除方法及系统_新疆农业科学院农业机械化研究所_202411082392.0

牙科种植导板、视觉导向系统及其配准方法_雅客智慧(北京)科技有限公司_202010643123.2

一种基于视觉分析的工程监测系统_广东精信工程造价咨询有限公司_202410282561.9

一种嵌件外观视觉检测装置_苏州图凌视界智能科技有限公司_202323456297.6

人脸相关技术

一种人脸识别方法_江苏科技大学_202111418910.8

人脸识别方法及装置_深圳须弥云图空间科技有限公司_202111360868.9

人脸驱动方法、装置及终端_影眸科技(上海)有限公司_202211075883.3

戴口罩人脸识别模型的训练方法及戴口罩人脸的识别方法_荣耀终端有限公司_202411451915.4

一种武装人脸识别方法、系统、电子设备和可读存储介质_中国人民解放军国防科技大学_202211533351.X

一种人脸图像的特征提取方法、识别方法、装置及设备_成都寻道科技有限公司_202411115006.3

人脸欺骗检测方法、装置、设备、存储介质及计算机程序产品_湖北工程学院_202410935530.9

一种面向边缘计算的人脸检测方法及系统_湘江实验室_202411422254.2

一种基于融合差分图卷积的人脸反欺诈方法及系统_华东交通大学_202411453247.9

语音驱动人脸视频生成方法、系统、存储介质和电子设备_浙江大学_202411063361.0

个性相关技术

一种义齿个性化设计方法_南通雅迪义齿有限公司_202410897726.3

基于情绪来产生个性化音频内容_哈曼国际工业有限公司_202410918975.6

一种个性化热转印机_义乌泰乐机械设备有限公司_202411324431.3

个性化在线自适应放疗PTV动态调整技术解决方案_中国医学科学院北京协和医院_202411376395.5

基于用户行为分析的个性化服务推荐系统_北京动网天下科技有限公司_202411148086.2

一种面向图神经网络的个性化隐私保护方法_北京理工大学_202410776307.4

一种基于提示学习的个性化推荐冷启动方法及系统_湖南师范大学_202411445468.1

一种个性化隐私政策生成方法、系统设备及介质_广州三七极梦网络技术有限公司_202410986938.9

基于大数据分析的学员个性化学习路径推荐方法和系统_德瑞骅科技(北京)有限公司_202411246357.8

一种中医药模型与个性化医疗推荐系统_中健华夏中医药产业发展(广东)有限公司_202411146109.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种轻量化个性人脸视觉配音方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务