基于扩散模型的视频生成方法、装置以及设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：星凡星启(成都)科技有限公司

摘要：本发明公开了基于扩散模型的视频生成方法、装置以及设备，包括：得到若干张抽帧图片；构建出若干个图片组；将初始数据空间中的图片组映射至隐空间；构建待训练扩散模型；为图片组中的每个隐变量添加噪声；将图片组输入待训练扩散模型中，得到每个图片组对应的若干个预测噪声和若干个预测图片差异，以及若干个图片组之间对应的预测图片组差异；根据若干个预测噪声、若干个预测图片差异以及若干个预测图片组差异，对待训练扩散模型的神经网络参数进行调节，并在当满足预设训练要求时，将待训练扩散模型作为目标扩散模型。本发明属于视频预测领域。本发明可以使基于扩散模型预测得到的视频保持时间一致性。

主权项：1.基于扩散模型的视频生成方法，其特征在于，所述方法包括：对待处理视频以预设步长进行抽帧，得到若干张抽帧图片；按照若干张抽帧图片的时间顺序和预设构建数量，构建出若干个图片组，其中，预设构建数量至少为3张，并且除第一个图片组外，每个图片组依次包含上一个图片组中的第一张抽帧图片和最后一张抽帧图片；将初始数据空间中的图片组映射至隐空间，其中，图片组中的每张抽帧图片对应一个隐变量；构建待训练扩散模型，所述待训练扩散模型的输入为图片组，所述待训练扩散模型的输出为预测噪声、预测图片组差异与预测图片差异；按照预设噪声添加规则，为图片组中的每个隐变量添加噪声；将图片组输入所述待训练扩散模型中，得到每个图片组对应的若干个预测噪声和若干个预测图片差异，以及若干个图片组之间对应的预测图片组差异；根据若干个预测噪声、若干个预测图片差异以及若干个预测图片组差异，对所述待训练扩散模型的神经网络参数进行调节，并在当满足预设训练要求时，将所述待训练扩散模型作为目标扩散模型。

全文数据：

权利要求：

百度查询：星凡星启(成都)科技有限公司基于扩散模型的视频生成方法、装置以及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种浴室用安全智能触摸开关面板

下一篇：一种具有多向角度可调的直播设备

相关技术

一种浴室用安全智能触摸开关面板

一种具有多向角度可调的直播设备

一种气凝胶隔热垫复合封装结构

一种能够调节的建筑幕墙防脱落装置

一种铝单板与龙骨的连接结构

一种汽车仪表台生产模具

一种支撑混凝土模板的定位装置

空调压缩机轴承装配工作台

一种标准混合气的自动化配制装置

一种可切换光源的光学检测设备

一种用于夜间钻探降噪及文明施工的围护设备

一种机械零件加工用工作台

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于扩散模型的视频生成方法、装置以及设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务