浙江大学罗亚威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于对齐的多模态4D内容生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120672972B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511179418.8,技术领域涉及:G06T17/00;该发明授权基于对齐的多模态4D内容生成方法及系统是由罗亚威;苗乔伟;杨易设计研发完成,并于2025-08-22向国家知识产权局提交的专利申请。
本基于对齐的多模态4D内容生成方法及系统在说明书摘要公布了:本发明公开了一种基于对齐的多模态4D内容生成方法及系统,属于计算机视觉处理领域。在本发明中,首先通过扩散模型将单模态输入转化为视频‑3D模型对,并以此初始化4D模型;获取视频对齐焦距和多视角对齐焦距,通过两阶段焦距对齐实现精确的时空配准;采用奇偶步交替优化3D高斯模型和形变网的异步优化策略来最小化由已知未知视角‑时刻对齐损失构成的总损失函数;最终生成的4D资产模型可输出任意视角‑时刻的渲染图像或连续视频,实现了高质量的多模态4D内容生成。本发明可以灵活处理多种输入,高效生成忠实于输入的4D资产模型。
本发明授权基于对齐的多模态4D内容生成方法及系统在权利要求书中公布了:1.一种基于对齐的多模态4D内容生成方法,其特征在于,包括以下步骤: S1:将任意单一模态的输入数据送入扩散模型,以生成由视频和3D模型构成的目标数据对; S2:由目标数据对中的3D模型初始化4D模型,并以目标数据对中的视频的第一帧作为对齐参照图像,在预设的焦距范围内渲染4D模型,以获取初始时刻每个焦距对应的主视角渲染图,计算每个主视角渲染图与对齐参照图像之间的均方差,将均方差最小值所对应的焦距作为视频对齐焦距; S3:在S2的焦距范围内将小于视频对齐焦距的焦距保留,形成新的焦距范围,在新的焦距范围内以不同视角渲染初始时刻的4D模型,在每个视角下计算每个焦距的渲染图对应的分数蒸馏采样损失值,并在相同焦距下对所有视角的损失值求平均,将损失平均值最小值所对应的焦距作为多视角对齐焦距; S4:以总损失函数最小化为目标对4D模型进行异步优化,在优化过程的奇数步仅优化4D模型中的3D高斯模型,而在偶数步仅优化4D模型中的形变网,将优化好的4D模型作为最终生成的高质量4D资产模型;所述总损失函数由已知时刻-视角对齐损失和未知时刻-视角对齐损失加权求和形成:对于已知视角和时刻,基于视频对齐焦距在主视角下渲染4D模型生成多时刻主视角渲染图,由多时刻主视角渲染图和目标数据对中的视频计算已知时刻-视角对齐损失;对于未知视角和时刻,基于多视角对齐焦距在非主视角下渲染4D模型生成多时刻多视角渲染图,通过多时刻多视角渲染图和多视角扩散模型先验之间对齐,迁移动作信息和几何信息到4D模型中,以构建动作对齐损失和几何对齐损失,并将动作对齐损失和几何对齐损失各自与一个时间相关的融合参数进行加权融合,得到未知时刻-视角对齐损失; S5:将观察视角和时刻参数输入高质量4D资产模型,得到对应的渲染图像;将连续的观察视角和时刻参数输入高质量4D资产模型,得到多时刻多视角的渲染视频,完成基于对齐的多模态4D内容生成。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励