中国科学院西安光学精密机械研究所张博学获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院西安光学精密机械研究所申请的专利一种超低轨场景下跨模态融合与多频率编码的视角图生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121259221B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511833907.0,技术领域涉及:G06T17/00;该发明授权一种超低轨场景下跨模态融合与多频率编码的视角图生成方法是由张博学;王锋;张高鹏;王子渊;毕恒源;邱宇杰;节静设计研发完成,并于2025-12-08向国家知识产权局提交的专利申请。
本一种超低轨场景下跨模态融合与多频率编码的视角图生成方法在说明书摘要公布了:本发明公开了一种超低轨场景下跨模态融合与多频率编码的视角图生成方法,解决了飞行器目标的超低轨场景中,基于扩散先验的视角条件生成与单图三维重建方法,因条件信息融合能力不足、辐射或光照表征受限与跨视角几何约束不充分,导致难以在大范围视角与尺度变化下同时获得纹理细节的视觉连贯与几何一致的新视角图像的问题;本发明对光线方向向量的感知编码有效捕捉方向分布的多阶角度信息,再对光线起点坐标的位置编码,最后对相机位姿参数的位姿编码,能够刻画相对姿态对图像生成过程中的深度感与透视畸变影响;上述三个编码结果用于潜在扩散模型的解码阶段,有效提升了在新视角下细节恢复的几何一致性。
本发明授权一种超低轨场景下跨模态融合与多频率编码的视角图生成方法在权利要求书中公布了:1.一种超低轨场景下跨模态融合与多频率编码的视角图生成方法,其特征在于,包括以下步骤: 步骤1、在超低轨场景下,对飞行器目标分别获取多视角序列图像及对应相机的外参矩阵,并根据图像的宽、高与设定视场角,计算相应的相机位姿参数,将其中一个视角序列图像作为主视角图像,剩余视角序列图像作为辅视角图像; 步骤2、采用CLIP编码器提取主视角图像的高维语义特征,将高维语义特征与主视角图像相应的相机位姿参数拼接,并输入轻量级跨模态注意力模块进行跨模态注意力融合,生成主视角高维条件向量; 步骤3、对于每个辅视角图像,采用基于多频率编码的球谐函数嵌入模型对光线方向向量的感知编码、对光线起点坐标采用多频率正余弦函数展开进行傅里叶位置编码并对相应的相机位姿参数进行位姿编码,将上述编码结果按照维度进行拼接、融合压缩得到每个辅视角图像相应的条件特征; 步骤4、构建由U-Net去噪网络、变分自编码器、解码器组成的潜在扩散模型;将飞行器目标的多视角序列图像分别输入变分自编码器获得干净潜在表示张量,并在潜在空间按前向扩散进行加噪得到潜在表示张量,作为U-Net去噪网络的输入; 步骤5、将主视角高维条件向量、每个辅视角图像相应的条件特征输入U-Net去噪网络,引导潜在表示张量迭代去噪,还原目标视角下的潜在表示,并经解码器映射后得到超低轨目标的新视角图像;针对每个视角,根据得到的超低轨飞行器目标的新视角图像与多视角序列图像中该视角的图像的差异,训练所述轻量级跨模态注意力模块、球谐函数嵌入模型以及U-Net去噪网络; 步骤6、将超低轨场景下待测飞行器目标的任一视角图像及新视角下相机的外参矩阵输入训练后的轻量级跨模态注意力模块、球谐函数嵌入模型以及U-Net去噪网络,得到待测飞行器目标的新视角图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院西安光学精密机械研究所,其通讯地址为:710119 陕西省西安市高新区新型工业园信息大道17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励