恭喜成都索贝数码科技股份有限公司陈尧森获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜成都索贝数码科技股份有限公司申请的专利一种转场视频生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119211642B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411724736.3,技术领域涉及:H04N21/44;该发明授权一种转场视频生成方法及系统是由陈尧森;刘跃根;温序铭设计研发完成,并于2024-11-28向国家知识产权局提交的专利申请。
本一种转场视频生成方法及系统在说明书摘要公布了:本申请公开了一种转场视频生成方法及系统,属于图像生成技术领域。本申请方法将首尾两帧图像分别输入变分自动编码器,以提取其潜在特征,并在正序和倒序的潜在特征之间引入预设帧数的噪声。接着,对首尾两帧图像进行描述,使用文本特征提取器提取相应的文本特征,并通过球面线性插值获得与帧数对应的图像描述特征。随后,这些描述与潜在特征共同输入预训练的文本和图像引导的视频生成扩散模型进行去噪处理。在去噪过程中,生成包含中间帧信息的噪声特征,并通过高斯过程对正序和倒序噪声特征施加时序约束。接下来,进行高低频分离与加权融合,再次进行去噪处理。最终,利用视频生成模型的解码器生成首尾两帧之间连贯流畅的转场视频。
本发明授权一种转场视频生成方法及系统在权利要求书中公布了:1.一种转场视频生成方法,其特征在于,所述转场视频生成方法包括如下步骤:S100:将用于生成转场视频的首帧和尾帧输入变分自动编码器以提取图像特征,然后在提取的特征帧之间插入预设帧数的噪声,分别生成正序和倒序的噪声特征序列;S200:分别描述用于生成转场视频的首尾两帧图像,并提取相应的文本特征,再利用球面线性插值获得与帧数对应的文本描述特征;S300:将S100获得的正序和倒序的噪声特征结合S200获得的文本描述特征输入预训练的文本和图像引导的视频生成扩散模型进行去噪处理,并提取去噪的中间特征;步骤S300包括:S310:将正序和倒序特征分别与对应中间文本特征进行特征融合,使用交叉注意力机制或者特征累加叠加形式,获得包含文本信息的正序噪声特征和倒序噪声特征;S320:将获得的正序噪声特征和倒序噪声特征输入至视频去噪模型;S330:将视频去噪模型中提取的去噪特征,作为中间特征;S400:针对S300提取的正序和倒序的中间特征,利用高斯过程为正序和倒序的噪声特征分别建立时序约束;S500:对上S400获得的正序和倒序的高斯约束噪声特征进行高频与低频分离,并对两者赋予不同权重后相加,插值恢复至原始特征尺寸;S600:将加权融合后的正序与倒序特征帧按帧顺序进行加权融合,重复S300至S500,直到去噪特征达到收敛状态;S700:将完成去噪且噪声水平稳定的特征帧,输入视频生成解码器,生成转场视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都索贝数码科技股份有限公司,其通讯地址为:610041 四川省成都市高新区新园南二路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。