虚拟形象说话视频的合成方法、装置、设备及存储介质

导航：龙图腾网> 最新专利技术> 虚拟形象说话视频的合成方法、装置、设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：平安科技(深圳)有限公司

摘要：本发明涉及人工智能技术领域，公开了一种虚拟形象说话视频的合成方法、装置、设备及存储介质，用于在虚拟形象素材量少的情况下，提高视频合成精度。所述虚拟形象说话视频的合成方法包括：通过预先训练的虚拟形象语音生成模型对目标答案文本进行待合成虚拟形象的文本语音生成，得到目标文本音频；通过预先训练的人物说话视频生成模型对目标文本音频和原始图像进行说话人脸视频生成，得到初始虚拟形象说话视频；通过口型同步鉴别器和视觉质量鉴别器对初始虚拟形象说话视频进行口型同步鉴别和视觉质量鉴别，得到鉴别结果；基于鉴别结果确定目标虚拟形象说话视频。此外，本发明还涉及区块链技术，目标虚拟形象说话视频可存储于区块链节点中。

主权项：1.一种虚拟形象说话视频的合成方法，其特征在于，所述虚拟形象说话视频的合成方法包括：获取待合成虚拟形象的虚拟形象音频样本和所述虚拟形象音频样本对应的文本信息，并初始化文本语音生成模型，所述文本语音生成模型包括读取器和神经网络声码器；对所述虚拟形象音频样本进行声码器特征提取，得到音频声码特征信息，并通过所述读取器对所述虚拟形象音频样本对应的文本信息进行声码器特征提取，得到文本声码特征信息；通过所述神经网络声码器对所述文本声码特征信息进行音频生成，得到目标样本音频；根据所述音频声码特征信息与所述文本声码特征信息之间的第一损失值和所述目标样本音频与所述虚拟形象音频样本之间的第二损失值，对所述文本语音生成模型进行多轮权重值的迭代更新，得到虚拟形象语音生成模型；获取说话人脸视频样本，并初始化生成网络对抗网络模型，所述生成网络对抗网络模型包括未训练的生成器、口型同步鉴别器和视觉质量鉴别器；从所述说话人脸视频样本中提取随机参考帧和样本音频，并通过所述未训练的生成器对所述随机参考帧和所述样本音频进行说话视频生成，得到初始说话视频；通过未训练的口型同步鉴别器和视觉质量鉴别器对所述初始说话视频和所述说话人脸视频样本进行逐帧的口型同步性判别和视觉质量判别，得到第一判别结果；基于所述第一判别结果对未训练的口型同步鉴别器和视觉质量鉴别器进行多轮权重值的迭代更新，得到预先训练的口型同步鉴别器和视觉质量鉴别器；通过预先训练的口型同步鉴别器和视觉质量鉴别器对所述初始说话视频进行逐帧的口型同步性判别和视觉质量判别，得到第二判别结果，并通过所述第二判别结果对所述未训练的生成器进行多轮权重值的迭代更新，得到预先训练的生成器；基于所述预先训练的口型同步鉴别器和视觉质量鉴别器和所述预先训练的生成器，生成人物说话视频生成模型；接收虚拟形象说话视频合成请求，并通过所述虚拟形象说话视频合成请求从预置问答库中匹配目标答案文本；通过预先训练的虚拟形象语音生成模型中的读取器和神经网络声码器对所述目标答案文本进行待合成虚拟形象的文本语音生成，得到目标文本音频；获取所述待合成虚拟形象的原始图像，并通过预先训练的人物说话视频生成模型中的生成器对所述目标文本音频和所述原始图像进行说话人脸视频生成，得到初始虚拟形象说话视频，所述人物说话视频生成模型包括生成器、口型同步鉴别器和视觉质量鉴别器；通过所述口型同步鉴别器和所述视觉质量鉴别器对所述初始虚拟形象说话视频进行口型同步鉴别和视觉质量鉴别，得到鉴别结果；基于所述鉴别结果确定所述初始虚拟形象说话视频对应的目标虚拟形象说话视频。

全文数据：

权利要求：

百度查询：平安科技(深圳)有限公司虚拟形象说话视频的合成方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：计及电池寿命的电热氢混合储能系统容量优化配置方法

下一篇：可冲散无纺布制备新工艺及应用

相关技术

计及电池寿命的电热氢混合储能系统容量优化配置方法

可冲散无纺布制备新工艺及应用

金属燃料电池与其他类型蓄电池的协同应用系统及方法

一种碳纤维纺丝前驱体及碳纤维的生产方法

一种像控点坐标生成方法、系统、设备及存储介质

一种正负可调叠加高频脉冲的电源

一种潮气量检测系统及装置

带有非自驱动吸入阀的往复式压缩机

一种耳道清洗装置

定子组件、电机、压缩机和制冷设备

折边装置、折边系统及折边方法

一种汽轮机启动疏水再利用系统及其方法

合成相关技术

一种合成装置_山东鼎信新材料科技有限公司_202322875554.3

一种对苯基苯酚酰化反应合成装置及合成方法_东营科宏化工有限公司_202410703600.8

一种杂环化合物合成装置及合成方法_怀化旺达生物科技有限公司_202410715319.6

经由多模态条件的视频合成_斯纳普公司_202380021845.6

声浪合成方法、装置及车辆_小米汽车科技有限公司_202310295210.7

一种药物合成反应装置_江苏利泰尔药业有限公司_202323452069.1

硅烷化合物的合成_迈图高新材料公司_202380021896.9

纳米催化剂的合成装置_盐城名杰纸品包装有限公司_201910258945.6

一种多肽合成设备_海宁博上生物科技股份有限公司_202420285924.X

一种温和可控合成金属间化合物的合成方法和装置_武汉吉兆储能科技有限公司_202410858906.0

方法相关技术

记录方法_精工爱普生株式会社_202410329157.2

分类方法_株式会社半导体能源研究所_202080059927.6

分离方法_大金工业株式会社_202380021486.4

唤醒信号的接收方法、发送方法、配置方法、装置及设备_OPPO广东移动通信有限公司_202280091619.0

原版、确定原版的图案的方法、曝光的方法、以及制造物品的方法_佳能株式会社_202410311669.6

信号传输方法、信号检测方法、装置及通信设备_维沃移动通信有限公司_202310304876.4

验证方法_上海兆芯集成电路股份有限公司_202011127602.5

接入处理方法、信息处理方法、配置发送方法及设备_维沃移动通信有限公司_202310290704.6

训练SEM图像选择方法及使用该方法的SEM设备对准方法_三星电子株式会社_202410252998.8

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

装置相关技术

装置_大北方研究创新有限公司_201980073960.1

加热装置、定影装置及图像形成装置_株式会社理光_202410290644.2

加热装置、定影装置及图像形成装置_株式会社理光_202410289453.4

冷却装置、光源装置以及图像投影装置_株式会社理光_202410335851.5

报文发送装置及接收装置_成都云豹创芯智能科技有限公司_202410956864.4

定影装置及图像形成装置_富士胶片商业创新有限公司_201980097266.3

电化学装置及电子装置_东莞新能源科技有限公司_202111683379.7

编码装置、解码装置以及程序_日本放送协会_202410973027.2

介质输送装置以及记录装置_精工爱普生株式会社_202410329173.1

马达驱动装置以及制冷循环装置_三菱电机株式会社_202280091827.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

虚拟形象说话视频的合成方法、装置、设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务