南京理工大学张钰浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利一种遥感图像描述的先验知识指导Transformer方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119339228B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411264436.1,技术领域涉及:G06V20/10;该发明授权一种遥感图像描述的先验知识指导Transformer方法及系统是由张钰浩;孟令武;陈江悦;钱海源;肖亮设计研发完成,并于2024-09-10向国家知识产权局提交的专利申请。
本一种遥感图像描述的先验知识指导Transformer方法及系统在说明书摘要公布了:本发明公开了一种遥感图像描述的先验知识指导Transformer方法及系统,包括:采用遥感旋转目标检测模型提取目标级特征;结合图神经网络和注意力机制构建目标‑目标关系;获取遥感图像全局表征;堆叠先验知识增强注意力和前馈神经网络,指导模型关注与场景点积相似度大于设定阈值的目标,并捕获不同层次的视觉信息;采用网状连接结构进行所有层次视觉信息和文本信息交互;根据文本解码器的输出得到词汇表的单词概率分布,逐步产生单词。本发明充分建立场景‑目标语义关联,借助图结构有效区分相似的目标,增强了描述的准确性,引入先验的场景‑目标知识指导模型关注与特定场景相关的目标,具有较好的语义一致性。
本发明授权一种遥感图像描述的先验知识指导Transformer方法及系统在权利要求书中公布了:1.一种遥感图像描述的先验知识指导Transformer方法,其特征在于,包括以下步骤: 第一步,特征提取模块中采用遥感旋转目标检测模型ReDet提取指定数量的感兴趣区域作为目标级特征,并通过全连接层投影到d维空间; 第二步,将第一步特征提取模块提取的特征作为输入,利用特征增强模块增强目标级特征; 第三步,类别插入模块将ClasstokenVcls作为场景级特征与目标级特征拼接,作为视觉编码器模块的输入; 第四步,视觉编码器模块堆叠B个编码层;每个编码层利用先验场景-目标知识指导模型关注与场景点积相似度大于设定阈值的目标,并利用前馈神经网络实现对输入向量的非线性变换和处理,从而增强模型的表达能力;所有编码层的输出作为视觉编码器的输入; 第五步,文本嵌入模块采用词嵌入和位置编码得到文本特征; 第六步,文本解码器模块堆叠B个解码层,接收视觉编码器的输出和文本特征;每个解码层首先将文本特征输入掩码自注意力以保证序列生成的因果关系,再通过网状交叉注意力建立多层视觉-文本模态间交互,最后利用前馈神经网络增强特征表达能力;最后一个解码层的输出作为文本解码器的输出,输入到文本生成模块; 第七步,文本生成模块,通过全连接层和softmax层,得到词汇表单词概率分布,逐步产生单词。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励