首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于改进Faster-RCNN的探地雷达地下管线目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:本发明公开了一种基于改进Faster‑RCNN的探地雷达地下管线目标检测方法。该方法以探地雷达B‑Scan图像作为输入,输出在图像中检测到的目标。所述目标为地下管线在探地雷达B‑Scan图像中呈现的双曲线特征。其具体步骤包括:探地雷达数据集获取;设计Faster‑RCNN探地雷达管线目标检测框架,设计注意力机制模块并嵌入到ResNet50特征提取网络中,在FPN特征金字塔特征融合部分使用密集上采样卷积模块进行上采样;改进IoU并训练目标检测网络;将待检测图像输入到训练好的检测网络中实现地下管线目标信号的检测。本方法根据探地雷达管线目标的双曲线特征对Faster‑RCNN进行了改进,实现了高效的关键特征提取,能够更好的捕捉到图像中的细节信息,对提高探地雷达管线目标检测精度有重要意义。

主权项:1.基于改进Faster-RCNN的探地雷达地下管线目标检测方法,其特征在于:依次包括:进行探地雷达数据集的获取;设计Faster-RCNN目标检测框架,设计注意力机制模块嵌入到骨干特征提取网络中,在FPN特征融合部分使用密集上采样模块来进行上采样;改进IoU并训练目标检测网络;将待检测B-Scan图像输入到训练好的目标检测网络中实现地下管线目标信号的检测;具体步骤包括:步骤一:探地雷达数据集的获取数据集由两部分组成:一部分利用探地雷达数值仿真软件生成作为训练集,另一部分在实际环境下采集作为测试集,两部分数据集设置同样的参数;探地雷达发射波采用中心频率为600MHz的雷克子波,获取探地雷达数据形成B-Scan图像并使用标注软件对获取的B-Scan图像进行双曲线特征的标注;一共生成1600张仿真探地雷达图像并采集300张实际场景下的图像;步骤二:设计改进的Faster-RCNN目标检测框架使用Faster-RCNN作为基准网络,Faster-RCNN检测框架由三部分组成:Backbone,Neck,Head;使用ResNet50作为骨干特征提取网络,并在其中添加注意力机制来生成精细化的语义特征图;Neck部分使用FPN,使用密集上采样卷积来替代线性插值法;Head部分进行目标分类和边界框的回归;子步骤一:特征提取模块设计该模块的输入为探地雷达B-Scan图像;特征提取网络使用ResNet50深度残差网络;输入图片尺寸640×640×3,使用ResNet50进行图像特征提取,其包括五个卷积模块,输入通道数为in_planes,输出通道数为out_planes;Conv1:输入通道in_planes=3,输出通道out_planes=64,输出得到320×320×64的特征图;Conv2_x:输入通道in_planes=64,输出通道out_planes=256,输出得到160×160×256的特征图C2;Conv3_x:输入通道in_planes=256,输出通道out_planes=512,输出得到80×80×512的特征图C3;Conv4_x:输入通道in_planes=512,输出通道out_planes=1024,输出得到40×40×1024的特征图C4;Conv5_x:输入通道in_planes=1024,输出通道out_planes=2048,输出得到20×20×2048的特征图C5;子步骤二:注意力机制设计对获取的特征图C2、C3、C4、C5应用注意力机制模块;所设计的注意力机制包括空间注意力机制和通道注意力机制,首先通过通道注意力机制获得通道级特征图,然后通过空间注意力进一步进行空间级细化特征提取;令特征图F∈RC×H×W表示通道注意力机制模块的输入,通道注意力如下:池化层:输入维度为C×H×W,输出维度为C×H2×W2,使用平均值池化,卷积核大小为2,步长为2;卷积层:输入维度为C×H2×W2,输出维度为2C×H4×W4,卷积核大小为3;权重生成层:输入维度为2C×H4×W4,输出维度为C×1×1,先使用最大值池化和卷积核大小为1的卷积操作核将维度变为C×1×1,最后使用Sigmoid激活函数生成通道级注意力权重表征各个通道的重要程度;空间注意力串联于通道注意力之后,将通道注意力权重与输入特征图进行相乘进行通道信息增强,空间注意力模块输入为通道注意力模块的输出;令特征图F∈RC×H×W表示空间注意力机制模块的输入,空间注意力如下:通道压缩层:输入维度为C×H×W,输出维度为3×H×W;对F进行三种操作:最大池化、均值池化以及卷积核大小为1的卷积操作来对通道信息进行压缩,按照通道注意力模块产生的通道级权重进行加权求和,将获得的三个特征图进行通道堆叠;权重生成层:输入维度为3×H×W,输出维度为1×H×W;先进行卷积核大小为3×3的卷积操作降维,然后使用Sigmoid函数获取空间注意力权重;所设计的通道注意力和空间注意力用如下公式表示:MCF=σf1x1MaxPoolf3x3AvgPoolF1MSF=σf3x3AvgPoolMCF;MaxPoolMCF;f1x1MCF2其中MCF和MSF分别表示通道注意力和空间注意力,σ表示Sigmoid激活函数,f1x1和f3x3分别表示卷积核大小为1×1和3×3的卷积操作;将该注意力机制嵌入到特征图C2、C3、C4、C5后进行更精细的空间级和通道级特征提取;子步骤三:特征融合模块设计该模块的输入为经注意力机制细化提取后的C2、C3、C4、C5特征图;Neck模块使用FPN将Backbone高层提取到的丰富的语义特征和Backbone低层丰富的细节特征进行融合,获得P2、P3、P4、P5,并对P5进行最大值池化获得P6,将这些特征图用于Head进行预测框回归和分类;上采样过程中使用最近邻插值上采样会导致部分特征的详细信息损失,因而采用密集上采样卷积进行替换;首先将得到的特征图Hr×Wr×C输入到一组3×3卷积中进行学习,卷积后得到的特征图大小为Hr×Wr×C×r2,然后重塑为H×W×C大小,r是上采样恢复的特征图与原始特征图大小的比值;步骤三:改进IoU并训练目标检测框架在探地雷达的B-Scan图像中,双曲线重叠的现象非常多,然而常见的IoU改进如CIoU、DIoU在该种情况下表现很差,在其检测结果中出现大量冗余检测框,,因此使用了一种改进IoU,其公式为: 其中A、B分别代表预测框和真实框,C为包含A、B的最小区域;IoU的范围为[0,1],则从式中可以推出newIoU的范围为[-1,1];当预测框和真实框重合时取得最大值1,当预测框和真实框没有交集且两者相距无穷远时最小值是-1;该IoU引入了包含预测框和真实框的最小面积C,同时引入了距离度量;将B-Scan图像输入到目标检测网络中进行训练;训练过程中,目标分类损失和置信度损失均采用二元交叉熵损失函数计算,位置损失采用基于改进IoU的损失函数;具体地,基于改进IoU的损失函数计算方式如下:LnewIoU=1-newIoU4其中LnewIoU为非负值,基于损失函数LnewIoU还可以更好地优化回归框的位置,避免了直接使用IoU作为损失函数的弊端;步骤四:使用训练好的网络进行目标检测将探地雷达B-Scan图像输入网络,即可得到该探地雷达图像中地下管线目标的矩形框参数。

全文数据:

权利要求:

百度查询: 东南大学 基于改进Faster-RCNN的探地雷达地下管线目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。