西北工业大学宁波研究院;大湾区大学张艳宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学宁波研究院;大湾区大学申请的专利一种基于扩散模型的可见与红外光图像转换系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120912421B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511456340.X,技术领域涉及:G06T3/04;该发明授权一种基于扩散模型的可见与红外光图像转换系统及方法是由张艳宁;冉令燕;王立栋;王广聪;王鹏设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本一种基于扩散模型的可见与红外光图像转换系统及方法在说明书摘要公布了:本发明涉及一种基于扩散模型的可见与红外光图像转换系统及方法,通过视觉语言理解模块融合文本描述生成图像文本描述,以图像文本描述作为扩散模型算法的控制标志位,使扩散模型框架执行的扩散模型算法能够根据语义指令精确调控红外图像的风格特征,最终克服了传统单风格图像转换存在风格控制方面不足的技术缺陷,且充分利用语义信息和可控制标志位,使整个系统生成的红外图像关键区域的语义一致性大幅提升。
本发明授权一种基于扩散模型的可见与红外光图像转换系统及方法在权利要求书中公布了:1.一种基于扩散模型的可见与红外光图像转换系统,其特征在于,包括: 视觉语言理解模块,被设置为对可见光图进行基于自注意力映射的图像编码以获得图像特征,随后在所述图像特征上融入预设的文本描述生成控制标志位,并进行解码以获得图像文本描述; 扩散模型框架,与所述视觉语言理解模块通信,被设置为通过扩散模型算法将预设的噪声图、所述可见光图、所述可见光图的分割图、红外单光数据和所述图像文本描述转化为三种风格的红外图像; 所述可见光图的分割图是通过预训练分割模型将可见光图进行转化而得到; 所述扩散模型框架包含三个阶段的训练:第一阶段的训练是以低秩矩阵分解的形式对该扩散模型框架进行微调,使得该扩散模型框架具有根据关键字红外生成红外图像的能力;第二阶段的训练是利用该扩散模型框架提取可见光图和对应红外图像的普遍映射关系,使得该扩散模型框架具有把可见光图像转换为红外图像的能力;第三阶段的训练是基于特定风格可见光-红外图像对数据集得到风格信息,利用该扩散模型框架融合视觉语言信息和风格信息得到特定风格的红外图像; 所述视觉语言理解模块包括图像编码器和文本解码器,所述图像编码器包括依次串联的自注意力模块、编码控制器和前馈模块一,所述编码控制器还与所述文本解码器通信,所述编码控制器被设置为调用所述自注意力模块对所述可见光图进行自注意力映射处理以获得自注意特征,将所述自注意特征与所述可见光图进行求和以获得求和图像;随后调用所述前馈模块一对所述求和图像进行前馈网络模型的映射处理以获得前馈特征图,将所述前馈特征图与所述求和图像进行求和以获得所述图像特征; 所述文本解码器包括因果注意力模块、交叉注意力模块、前馈模块二和解码控制器,所述解码控制器同时与所述因果注意力模块、所述交叉注意力模块、所述前馈模块二和所述扩散模型框架通信,所述交叉注意力模块还与所述编码控制器通信; 所述解码控制器被设置为调用所述因果注意力模块对所述文本描述生成控制标志位进行因果注意力映射以获得因果注意力特征,将所述因果注意力特征与所述文本描述生成控制标志位进行求和以获得融合特征一;随后调用所述交叉注意力模块对所述融合特征一与所述图像特征进行交叉注意力映射以获得交叉特征,将所述交叉特征与所述融合特征一进行求和以获得融合特征二;最后调用所述前馈模块二将所述融合特征二进行前馈网络模型的映射处理以获得前馈文本,将所述前馈文本与所述融合特征二进行求和以获得所述图像文本描述; 所述扩散模型框架包括: 潜空间编码模块,被设置为对所述噪声图、所述可见光图、所述可见光图的分割图和所述红外单光数据进行潜空间编码以获得编码一、编码二和编码三; 去噪模块,同时与所述解码控制器和所述潜空间编码模块通信,被设置为并列运行对所述编码一进行去噪以获得去噪结果一、对所述编码二进行去噪以获得去噪结果二和将所述图像文本描述与所述编码三的融合结果进行去噪以获得去噪结果三; 潜空间解码模块,与所述去噪模块通信,被设置为分别对所述去噪结果一、所述去噪结果二和所述去噪结果三进行潜空间解码以获得三种风格的红外图像; 所述去噪模块包括: 文本编码器,与所述解码控制器通信,被设置为对所述图像文本描述进行文本编码以获得文本特征; 交叉注意力层模型,与所述文本编码器通信,被设置为对所述文本特征进行交叉注意力映射以获得交叉文本特征; 第一阶段去噪网络,与所述潜空间编码模块通信,被设置为对所述编码一进行去噪以获得所述去噪结果一; 第二阶段去噪网络,与所述潜空间编码模块通信,被设置为对所述编码二进行去噪以获得所述去噪结果二; 第三阶段去噪网络,同时与所述交叉注意力层模型和所述潜空间编码模块通信,被设置为对所述交叉文本特征与所述编码三的融合结果进行去噪以获得所述去噪结果三。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学宁波研究院;大湾区大学,其通讯地址为:315100 浙江省宁波市高新区清逸路218弄智造港A区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励