买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开一种基于anchor自学习的目标检测方法,属于目标检测技术领域。通过设计基于anchor的目标检测网络结构实现,该目标检测网络结构由一个主干网络和两个完全连接的分支两部分构成。在faster‑rcnn算法的基础上另外设计了一个anchorscales与aspectratio生成网络,即anchorscales与aspectratio学习器,该学习器将四通道数据输入到设计的网络中,生成经过优化的anchorscales与aspectratio。利用网络自适应学习锚点框的基本尺度和长宽比,满足不同数据集的设计需求;第二部分是RPN网络,通过使用RPN对网络进行训练。该网络把设计的锚点框学习器生成的anchorscales与aspectratio赋值给RPN的anchor生成器,用以生成最优的anchor大小对目标进行更好的检测。本发明让算法具有数据自适应能力实现对目标的全覆盖,具有较好的准确性和鲁棒性。
主权项:1.一种基于anchor自学习的目标检测方法,其特征在于,所述的目标检测方法通过设计基于anchor的目标检测网络结构实现;设计的目标检测网络结构分为两部分:两个完全连接的分支和主干网络;两个完全连接的分支是用于预测anchorscales与aspectratios的学习器网络,主干网络是FasterR-CNN的RPN网络;具体的设计过程如下:所述的预测anchorscales与aspectratios的学习器网络是指在FasterR-CNN算法的anchor生成结构上增加一个学习anchorscales与aspectratios的网络模块,用于自动学习anchor的最佳形状;所述的预测anchorscales与aspectratios的学习器网络输入的数据为RGB和ground-truthmask图像数据组成的四通道数据,FasterR-CNN的RPN网络输入为RGB三通道图像数据;为了学习到anchor的最佳形状,利用主干网络最后一层的特征图来预测anchorscales;主干网络的最后一层的特征图总共输出35*1个矢量值,将其转换为5*7矩阵,利用softmax函数对每行进行操作,使输出的数据在0到1之间,最后将每行数据乘以设计的初始anchorscales,通过与初始anchorscales相乘,anchorscales的取值在8到512之间;这里初始anchorscales设为8,16,32,64,128,256,512;同时为了学习到anchor的最佳形状,利用主干网络最后一层的特征图来预测aspectratios;首先,主干网络最后一层的特征图通过全连接层生成18*1个矢量值,将其转换为3*6矩阵,再利用softmax函数对每行进行操作,使输出的数据在0到1之间,最后将每行数据乘以设计的初始aspectratios;通过与初始aspectratios相乘,aspectratios的取值在0.1到2.5之间;这里初始aspectratios设为0.1,0.5,1.0,1.5,2.0,2.5;设计的网络模块中anchorscales与aspectratios的生成表示为:AS=F1x11Aa=F2x12其中,x1表示输入的数据,F1和F2表示设计的网络函数,AS表示输出的anchorscales,Aa表示输出的aspectratios;将学习到的最佳anchorscales与aspectratios直接赋值到FasterR-CNN的anchor模块中,即得到最优的anchor尺寸;对生成的最优的anchors进行分类和回归;该分类是一个二元分类器,用于判断像素特征属于前景还是背景,并通过回归进行位置偏移预测,最后通过非极大抑制生成所需的候选区域,对生成的候选区域进行细致的分类和检测;采用mmdetection框架,将特征金字塔网络自动的嵌入FasterR-CNN中,则候选区域的生成不仅在最后一层的特征图上,也可以在前几层的特征图上;生成anchor后,再进行二元分类和回归,确定候选区域,最后进行目标精细检测和分类;基于anchor自学习的目标检测方法,具体算法包括如下步骤:首先,把训练数据集划分为两部分P1、P2,P1可为原有训练集的任意45,P2为剩余的15部分;第二,将其中的一部分数据P1用于训练本发明设计的基于anchor的学习器网络;第三、把另一部分数据P2输入到上一部分训练好的基于anchor的学习器网络当中进行推理操作并平均其结果;第四、对第三步最终输出的数据求取平均值后,得到最佳的anchorscales与aspectratios大小;第五、将得到的最优值直接赋值到提出的anchor-based算法中;第六、对基于FasterR-CNN设计的算法在整个训练集中进行训练检测使用L1损失函数和二分类损失函数来训练网络,表示为如下形式:Loss=Lcls+Lreg3其中Lcls为二元分类损失函数,Lreg为L1损失函数。
全文数据:
权利要求:
百度查询: 中国人民解放军军事科学院国防科技创新研究院 一种基于anchor自学习的目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。