一种用于双时相遥感图像语义变化检测的网络模型

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华东交通大学

摘要：一种用于双时相遥感图像语义变化检测的网络模型，包括双时相孪生网络、Transformer模块、多任务头和时空特征学习模块；双时相孪生网络使用CNN骨干网络从输入的双时相遥感图像对中提取多尺度特征图，并将多尺度特征图转换为视觉标记，所述双时相孪生网络包括两个CNN骨干网络，CNN骨干网络采用残差网络ResNet，两个CNN骨干网络之间共享权重，Transformer模块用于捕获视觉标记之间的长距离依赖关系，得到Transformer模块的输出特征图；多任务头用于基于Transformer模块的输出特征图，生成语义分割和二值变化检测的预测输出；时空特征学习模块用于二值变化检测任务。该网络模型能够充分探索二值变化检测和语义分割之间的相关性，使这两个任务能够相互促进，实现高性能的语义变化检测。

主权项：1.一种用于双时相遥感图像语义变化检测的网络模型，其特征在于，包括双时相孪生网络、Transformer模块、多任务头和时空特征学习模块，所述Transformer模块具有编码器和解码器；所述双时相孪生网络使用CNN骨干网络从输入的双时相遥感图像对中提取多尺度特征图，并将多尺度特征图转换为视觉标记，所述双时相孪生网络包括两个CNN骨干网络，所述CNN骨干网络采用残差网络ResNet，两个CNN骨干网络之间共享权重，在所述双时相孪生网络中使用空间注意模块将空间位置信息嵌入到多尺度特征图中，并通过采样和像素级相加操作融合多尺度特征图；所述Transformer模块用于捕获视觉标记之间的长距离依赖关系，得到Transformer模块的输出特征图；所述多任务头用于基于Transformer模块的输出特征图，生成语义分割和二值变化检测的预测输出；所述时空特征学习模块用于二值变化检测任务，使第一二值变化检测的结果与第二二值变化检测的结果一致，其中，将双时相遥感图像对中的图像按时间顺序排列，得到的二值变化检测结果为第一二值变化检测的结果，将双时相遥感图像对中的图像按时间倒序排列，得到的二值变化检测结果为第二二值变化检测的结果；所述CNN骨干网络包括一个7×7卷积层、以及四个残差块，其中残差块Res3和残差块Res4执行2倍下采样；对于输入的尺寸大小为3×H×W的双时相遥感图像对，W和H分别表示输入图像的宽度和高度，CNN骨干网络从图像和图像中分别提取出三幅不同尺度的特征图，然后，特征图通过空间注意模块进行处理，最后，对于每个时相分支，特征图与同一时相分支的其他两个特征图通过采样和像素级相加进行融合，从而输出特征图；在所述双时相孪生网络中，首先对将特征图应用1×1卷积，然后采用softmax层，以获得m个尺寸大小为h×w的空间注意力图，其中，h和w分别个表示特征图的高度对应的维度和特征图的宽度对应的维度，表示时相i、尺度j所在时相分支对应的一个空间注意力图中的第k列，然后，使用空间注意力图对特征图应用加权平均池化操作，将特征图和空间注意力图的大小分别重塑为c×hw和hw×1，其中，c是特征图的通道数量，其中，使用空间注意力图对特征图应用加权平均池化操作满足下式：；其中，表示时相i、尺度j所在时相分支对应的视觉标记中的第k列；最后对进行拼接，得到时相i、尺度j所在时相分支对应的视觉标记；所述Transformer模块利用卷积操作将特征图转化为大小为m的视觉标记集；在视觉标记中添加一个可学习的位置编码得到标记化的特征图，所述编码器以标记化的特征图为输入，并生成编码后的输出特征图；所述编码器由Ne个结构相同的层堆叠组成，每一层包括多头自注意力模块和前馈神经网络模块，标记化的特征图在输入编码器后，从编码器的第l-1层到第l层需要依序经过多头自注意力模块和前馈神经网络模块处理，此外，使用层规范化对多头自注意力模块和前馈神经网络模块处理的输入进行规范化处理，并对两个模块的输出使用残差连接；所述编码器的第l-1层被层规范化后，第l-1层对应的特征图被传递到第l层的多头自注意力模块中，通过并行的N个独立的注意力头将输入特征映射到多个特征子空间中，其中，N个独立的注意力头不共享权重，每个注意头包括一个转化层和一个自注意力层，首先通过转化层将输入特征映射为一组键向量、值向量和查询向量；接着基于键向量、值向量和查询向量计算注意力矩阵，以得到多头自注意力模块中每个注意力头的输出特征，最后拼接各个注意力头的输出特征，并对拼接结果线性投影得到多头自注意力模块的输出特征；所述转化层用于将第l-1层对应的特征图映射为键向量、值向量和查询向量，对于第l层的第n个注意力头，多头自注意力模块关于的线性变换表示为：；；；其中，、、分别为与键向量、值向量、查询向量对应的线性矩阵；所述自注意力层的输出特征是通过值向量与softmax归一化后的注意力权重进行加权求和得到的，其中，对于第l层中的第n个注意力头，满足以下条件式：；其中，是通过计算每对视觉标记之间注意力权重得到的注意力矩阵，是沿着行维度对注意力矩阵进行归一化的函数，T表示转置操作，是缩放点积注意力机制的缩放因子；在得到注意力矩阵后，计算第n个注意力头的输出特征时使用两个时相分支的注意力矩阵来捕获跨时相相关性，其中，在第l层的两个时相分支中，第n个注意力头的输出特征表示为：；其中，、分别表示时相1对应的第n个注意力头的输出特征、时相2对应的第n个注意力头的输出特征，、分别表示时相1对应的注意力矩阵、时相2对应的注意力矩阵，、分别表示时相1对应的值向量、时相2对应的值向量；再将N个注意力头的输出特征拼接串接并投影得到第l层的多头自注意力模块的输出特征，表达式如下：；其中，concat表示拼接操作，表示第i时相对应的第1个注意力头的输出特征，表示第i时相对应的第2个注意力头的输出特征，表示第i时相对应的第N个注意力头的输出特征，表示投影矩阵；最后将多头自注意力模块的输出特征传递给前馈神经网络模块，前馈神经网络模块包括两个线性层，两个线性层之间有一个GELU激活函数；所述解码器将特征图、以及添加了可训练的位置编码的特征图作为输入；所述解码器将添加了可训练的位置编码的特征图映射到查询向量中，并将映射到键向量和值向量中，添加了可训练的位置编码的特征图经过Transformer模块处理后得到Transformer模块的输出特征图；所述多任务头包括两个语义分割头和一个二值变化检测头，所述多任务头中的每个任务头均包含三个2倍上采样块，每个上采样块使用最近邻上采样，在两个上采样块之前应用两个3×3卷积层；所述二值变化检测头包含时空特征学习模块，所述语义分割头不包含时空特征学习模块，所述语义分割头的预测输出的通道数量有两个，分别对应是否变化的两个类别，所述二值变化检测头的预测输出的通道数量等于预定义的语义类别的数量；在所述时空特征学习模块中，沿着通道维度将和连接起来，得到两个大小为2c×h×w的和，表达式为：；；其中，为时相1对应的Transformer模块的输出特征图，为时相2对应的Transformer模块的输出特征图，为时相1对应的新特征图，为时相2对应的新特征图；然后将和的大小从2c×h×w重塑为2×c×h×w，从而得到两个4D特征图；最后对两个4D特征图分别应用一个大小为k×k×k的3D卷积操作，然后，使用矩阵点乘将两个时空特征融合在一起，从而融合特征，表达式如下：；其中，Conv3d表示3D卷积操作，表示矩阵点乘；所述用于双时相遥感图像语义变化检测的网络模型的总损失包括两个语义分割损失和一个二值变化检测损失，分别采用多类别的交叉熵损失和二值交叉熵损失对语义分割损失和二值变化检测损失进行建模；其中，两个语义分割损失的表达式为：；；其中，、分别表示相对于时相1和时相2的语义分割损失，表示训练集中的像素数，CE表示交叉熵损失函数，、分别是语义分割任务关于第d个像素的真值标签，表示第d个像素对应于时相1的分支相对于的预测概率，表示第d个像素对应于时相2的分支相对于的预测概率；二值变化检测损失的表达式为：；其中，表示二值变化检测的预测结果与真值之间的损失，和分别表示第d个像素对应的真值和预测结果；所述用于双时相遥感图像语义变化检测的网络模型的总损失L的表达式为：；其中，为语义分割损失的权重。

全文数据：

权利要求：

百度查询：华东交通大学一种用于双时相遥感图像语义变化检测的网络模型

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电驱机械振动辅助负压可弯导引鞘

下一篇：振镜和激光雷达

相关技术

一种电驱机械振动辅助负压可弯导引鞘

振镜和激光雷达

一种船舶激振装置及船体振动试验分析方法

一种金属制品加工用数控刀头

基于AI的PCB或半导体多工序生产设备组合优化方法

一种智能型多功能机械伤害体验装置

一种拉杆切割打孔集成设备及加工工艺

一种具有抹平结构的高分子胶涂胶设备

电池充电时长确定方法、确定装置以及电池管理系统

具有处于低速档的分动箱的混合动力的动力总成系统和操作

信息处理系统以及信息处理方法

一种电池耐火防护装置及可行驶设备

语义相关技术

一种明确语义要素的科技文献检索方法与装置_中国科学院文献情报中心_202411087569.6

一种改进实时语义分割网络的岩屑图像识别方法_四川大学_202310224264.4

基于语义分析的会议记录生成方法及其装置、电子设备_中国工商银行股份有限公司_202410500777.8

基于长视频语义分析的高速公路事件检测方法及装置_杭州像素元科技有限公司_202411098951.7

一种面向图像超分辨率任务的语义通信方法_重庆大学_202410638813.7

自动驾驶场景下语义分割方法、存储介质及电子设备_重庆科技大学_202410359071.4

一种基于车车协同的点云语义分割方法_北京航空航天大学_202410826139.5

基于语义分析的在线评论自动回复方法、系统及存储介质_成都莫声科技有限公司_202411103062.5

基于二阶目标检测和语义识别的货车归属识别方法_南京信息技术研究院_202210469746.1

基于聚类思想的弱监督室内点云语义分割方法、装置及介质_复旦大学_202410703553.7

变化相关技术

监测架桥管补偿器变化装置_吴江港华燃气有限公司_202323245858.8

土地利用变化调查方法及系统_北京师范大学_202410762939.5

基于遥感指数的植被对水分变化敏感性识别方法_中国环境科学研究院_202410789962.3

海平面变化分析方法、装置、存储介质及电子设备_中国科学院西北生态环境资源研究院_202410739337.8

基于多层次差异信息联合增强的遥感影像变化检测方法_安徽大学_202410748707.4

基于温度变化中的故障事件智能识别温度变送器_江苏红光仪表厂有限公司_202410802729.4

一种用于监测建筑物裂缝变化量的设备_浙江绿建检测有限公司_202420025961.7

一种大范围无级变化的转动惯量加载方法及系统_广东省特种设备检测研究院中山检测院_202410903333.9

一种短路瞬态过程结温变化分析方法及装置_华北电力科学研究院有限责任公司_202410707126.6

一种防止轨道轨距变化的固定装置_尼勒克县瑞祥焦化有限责任公司_202323028387.5

图像相关技术

图像读取装置和图像形成装置_京瓷办公信息系统株式会社_202280006190.0

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410846234.1

图像解码装置、图像解码方法及程序_KDDI株式会社_202080057643.3

光学设备、图像读取设备和图像形成装置_富士胶片商业创新有限公司_201910842509.3

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410845655.2

图像处理系统及图像处理方法_北方集成电路技术创新中心(北京)有限公司_202410659049.1

图像处理装置、图像处理方法以及记录介质_柯尼卡美能达株式会社_202410124768.3

具有图像传感器的图像处理系统_桂林康基大数据智能研究院_202410720555.7

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410847055.X

图像形成装置及图像形成装置用单元_富士胶片商业创新有限公司_202311040536.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于双时相遥感图像语义变化检测的网络模型

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务