恭喜北京科技大学李擎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京科技大学申请的专利一种遥感图像指代分割方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119380033B 。
龙图腾网通过国家知识产权局官网在2025-04-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411979530.5,技术领域涉及:G06V10/26;该发明授权一种遥感图像指代分割方法和系统是由李擎;孔博;李江昀;刘丽;黄晨;鲁小雅;王圣然;英子瑄;单辰童;李茹惠;岳骏慧设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本一种遥感图像指代分割方法和系统在说明书摘要公布了:本发明公开一种遥感图像指代分割方法和系统,包括:将图像和指代文本输入第一阶段的指代检测模型,文本编码模块将指代文本映射为文本序列,语义词性特征提取模块对文本序列进行注意力加权,得到融合文本词性特征的文本特征,图像编码模块对图像进行初步的图像特征提取,将文本特征和图像特征拼接后输入特征提取器输出检测框和输出特征,将输出特征输入加权点回归任务头,预测输出关键点;将初始图像作为输入,检测框和关键点作为双提示,输入第二阶段的双提示分割模型,第二阶段图像编码器将图像编码为图像嵌入,双提示编码器将双提示编码,掩码解码器将图像嵌入和双提示编码进行特征融合得到最终的分割结果。本发明可以遥感图像进行指代分割。
本发明授权一种遥感图像指代分割方法和系统在权利要求书中公布了:1.一种遥感图像指代分割方法,其特征在于,所述方法包括:S1、获取需要进行分割的图像和指代文本;S2、将所述图像和指代文本输入训练完成的第一阶段的指代检测模型,所述指代检测模型包括文本编码模块、语义词性特征提取模块、图像编码模块、基于Transformer的特征提取器和加权点回归任务头,所述文本编码模块将所述指代文本映射为文本序列,所述语义词性特征提取模块对所述文本序列进行注意力加权,得到融合文本词性特征的文本特征,所述图像编码模块对所述图像进行初步的图像特征提取,将所述文本特征和图像特征拼接后输入所述特征提取器,进一步提取深层文本特征和图像特征,输出检测框和输出特征,将所述输出特征输入所述加权点回归任务头,进行关键点特征提取,预测输出关键点;S3、将初始的所述图像作为输入,将所述检测框和关键点作为双提示,输入训练完成的第二阶段的双提示分割模型,所述双提示分割模型包括第二阶段图像编码器、双提示编码器和掩码解码器,所述第二阶段图像编码器将所述图像编码输出为图像嵌入,所述双提示编码器将第一阶段获得的双提示进行编码,所述掩码解码器将所述图像嵌入和双提示编码进行特征融合,预测得到最终的分割结果;所述文本编码模块,使用字节对编码BPE作为文本编码器,将所述指代文本映射为文本序列L;所述语义词性特征提取模块,使用自然语言处理工具包NLTK作为语义词性特征提取器对文本进行词性特征提取,得到对应于每一个单词的词性描述{n.,a.,…,p.},并通过BPE转化为词性序列={,,…,},代表最大文本长度,用提取到的所述词性序列和所述文本序列L做加权交叉注意力,并且设置查询加权环节,使文本特征更加偏重于名词以及和位置信息相关的副词,加入大于1的超参数和,对于词性序列的可学习查询权重={,…,},当对应位置的文本词性为名词时,对应位置查询权重变为,当对应位置的文本词性为副词时,对应位置查询权重变为,其余位置权重变为,最终查询权重为={,…,},对于所述文本序列L设置可学习的键权重和值权重,经过以下交叉注意力运算得到语义词性加强的文本特征: ; ;其中为Q和K的维度;所述图像编码模块,使用可学习的残差网络作为第一阶段图像编码器,将图像划分为n个patch,并每个patch转换为维度为h的图像特征;所述特征提取器,由12个Transformer层堆叠而成,在最后一个Transformer的输出层接上检测框任务头和所述加权点回归任务头,输出得到包含检测框和关键点的双提示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。