Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学张艺杰获国家专利权

电子科技大学张艺杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利一种大模型驱动的高分辨率遥感图像解译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119851148B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411733922.3,技术领域涉及:G06V20/13;该发明授权一种大模型驱动的高分辨率遥感图像解译方法是由张艺杰;程建;朱遵妮;尹文祺;李丰恒;巨奎霖设计研发完成,并于2024-11-29向国家知识产权局提交的专利申请。

一种大模型驱动的高分辨率遥感图像解译方法在说明书摘要公布了:本发明公开了一种大模型驱动的高分辨率遥感图像解译方法,属于图像处理与分析领域。本发明包括:构建大规模的高分辨遥感图像数据集;对数据进行清洗和标注,划分训练集和验证集;构建多模态遥感信息智能提取大模型,实现多模态遥感特征的提取与协同;构建多模态遥感信息融合模块,实现可见光编码特征和热红外编码特征的融合;基于当前大语言模型的编码器来处理融合后的多模态特征,实现高分辨率遥感图像的解译。本发明所提方法的实施,能有效提升高分辨遥感图像解译的准确度。

本发明授权一种大模型驱动的高分辨率遥感图像解译方法在权利要求书中公布了:1.一种大模型驱动的高分辨率遥感图像解译方法,其特征在于,包括下列步骤: 步骤1、构建大规模的多模态高分辨遥感图像数据集,该多模态高分辨遥感图像数据集包括可见光图像和热红外图像;并对多模态高分辨遥感图像数据集中的图像数据进行图像预处理以获取模型训练的训练集; 其中,图像预处理包括各模态的图像数据格式统一、图像尺寸归一化和图像裁剪;其中,每幅图像的裁剪子图的尺寸和数量均一致,再将被裁剪图像缩放至裁剪子图尺寸;对每一种模态,将裁剪出的所有裁剪子图与缩放至裁剪子图尺寸的被裁剪图像视为一个样本; 步骤2,构建多模态遥感信息提取智能大模型,用于多模态遥感信息编码; 其中,多模态遥感信息提取智能大模型包括可见光信息编码器和热红外信息编码器,可见光信息编码器用于提取可见光图像的可见光编码特征,热红外信息编码器用于提取热红外图像的热红外编码特征; 步骤3,构建多模态遥感信息融合模块,用于对可见光编码特征和热红外编码特征进行多模态特征融合,输出融合后的多模态特征; 步骤4,基于大语言模型的编码器的网络结构构建用于高分辨遥感图像解译的多模态解码器,以融合后的多模态特征为多模态解码器的输入,基于其输出得到高分辨遥感图像的解译结果; 步骤5,基于多个样本构成的训练集对多模态遥感信息提取智能大模型、多模态遥感信息融合模块和多模态解码器构成的遥感图像解译模型进行模型参数的学习训练,当满足预置的训练收敛条件时,基于训练好的遥感图像解译模型获取输入目标图像的解译结果; 其中,步骤2中,多模态遥感信息提取智能大模型中的可见光信息编码器和热红外信息编码器结构相同,其分别包括n条并行的全局高阶信息嵌入Transformer分支,其中n的取值为每幅图像的裁剪子图数量加1; 其中,每一条全局高阶信息嵌入Transformer分支均包括m个级联的全局高阶信息嵌入Transformer模块,m为大于2的整数;每一个全局高阶信息嵌入Transformer模块对应一个阶段; 对n条分支中的同一阶全局高阶信息嵌入Transformer模块的输出特征图,通过跨区域信息联合智能感知模块进行信息联合感知,输出每一条支路的信息联合感知特征,再将其输出至对应支路的下一阶的全局高阶信息嵌入Transformer模块中; 全局高阶信息嵌入Transformer模块具体设置为: 对全局高阶信息嵌入Transformer模块的输入向量分别通过查询权重矩阵、键权重矩阵、值权重矩阵线性映射为查询向量Q、键向量K和值向量V; 对查询向量Q、键向量K和值向量V分别进行协方差池化操作,再将得到的池化向量和对应的池化前的向量进行点乘操作,得到新的向量、和; 将向量送入多头自注意力模块中进行自注意力机制计算,得到多头自注意力模块的输出,其中,代表softmax激活函数,代表向量的维度; 通过第一叠加amp;归一化层对多头自注意力模块的输出与全局高阶信息嵌入Transformer模块的输入向量进行特征叠加后再执行归一化操作,得到第一自注意力融合特征; 将第一自注意力融合特征送入全连接层,再对全连接层的输出,再通过第二叠加amp;归一化层对全连接层的输出和第一自注意力融合特征进行特征叠加后执行归一化操作,得到第二自注意力融合特征,即全局高阶信息嵌入Transformer模块的输出特征; 跨区域信息联合智能感知模块具体执行过程包括: 1对输入的每条全局高阶信息嵌入Transformer分支的特征图分别经过全局平均池化和全局最大池化,再对得到的两个池化结果逐元素相加得到每条支路的第一特征向量; 2将所有支路的第一特征向量逐元素相加后再通过若干层全连接层和一层ReLU激活函数层得到全局特征向量; 3将每条全局高阶信息嵌入Transformer分支的特征图分别与全局特征向量进行点乘,得到每一条支路的信息联合感知特征,以用于作为对应支路的下一阶段的全局高阶信息嵌入Transformer模块的输入特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。