首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于FSAF及快-慢速权重的目标检测与识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京理工大学

摘要:发明涉及基于FSAF及快‑慢速权重的目标检测与识别方法,属于监督学习及目标识别技术领域。包括:1搭建包括卷积层、特征图层、预测层的主干网络和RetinaNet有参考框分支;2搭建FSAF分支并生成图像特征层的有效区及忽略区,具体为:在RetinaNet有参考框分支中每个层级的预测层都添加一个无参考框分支,对标准框在不同特征层的映射框按照A1倍比例缩小后作为有效区、A2倍比例缩小后作为忽略区;3基于FSAF分支计算分类损耗加回归损耗的和:综合损耗;4将最优化特征层对应的综合损耗输入标准优化器及LookAhead优化器,使得综合损耗收敛。所述方法引入无参考框机制和Lookahead快‑慢速权重优化器,实现了比RetinaNet网络更好的识别效果,识别精准度和损耗收敛速度都有提升。

主权项:1.基于FSAF及快-慢速权重的目标检测与识别方法,其特征在于:包括如下步骤:步骤1、搭建包括卷积层、特征图层、预测层的主干网络和RetinaNet有参考框分支;其中,卷积层的数量就是特征金字塔的层数,记为N,预测层的数量也为N,特征图层的数量为N-2;步骤1包括如下子步骤:步骤1.1、原始图像作为第一层卷积层,并依次自下而上进行12采样,得到第2层到第N层卷积层,得到特征金字塔;步骤1.2、对特征金字塔不同层进行特征融合,得到第3到第N层特征图层;步骤1.3将步骤1.2得到的第N层特征图层及“第N-1到第3层”的特征图层分别进行3×3卷积,得到第N到第3层的预测层,共有N-2层;步骤1.4将步骤1.1中得到的第N层卷积层单独进行3×3卷积,得到第N+1层预测层;步骤1.5将步骤1.4得到的第N+1层预测层进行3×3卷积,得到第N+2层预测层;至此,通过步骤1.3到步骤1.5得到了和卷积层数目相同的N层预测层;其中,卷积层、特征图层以及预测层也构成了搭建好的主干网络;步骤1.6、在每层预测层后添加一个RetinaNet有参考框分支;步骤2、基于步骤1搭建的主干网络和RetinaNet有参考框分支搭建FSAF分支,并生成图像特征层的有效区及忽略区;具体为:在RetinaNet有参考框分支中每个层级的预测层都添加一个无参考框分支,对标准框在不同特征层的映射框按照A1倍比例缩小后作为有效区、A2倍比例缩小后作为忽略区;其中,所有无参考框分支统称为FSAF分支;步骤2中A1的取值范围为0.15到0.4;A2的取值范围为0.45到0.6;步骤2中无参考框分支包括分类子网和回归子网,分类子网的结构为“w×h×K卷积层+Sigmoid激活函数”,回归子网的结构为“w×h×4卷积层+ReLU激活函数”;有效区与忽略区之间为灰度区域;“有参考框分支中每个层级的预测层的输出”为对应分类子网中w×h×K卷积层的输入,该分类子网中w×h×K卷积层的输出为Sigmoid函数的输入;Sigmoid激活函数将“分类子网中w×h×K卷积层的输出”映射到0~1之间;K为分类子网中卷积层的3×3卷积核的数量,对应K个特征类型;ReLU函数是斜坡函数;w和h分别是标准框的高和宽;且标准框在原始数据中已经标注好;步骤3、基于FSAF分支计算综合损耗;其中,综合损耗包括分类损耗和回归损耗;步骤3具体为:步骤3.A通过式1计算分类损耗: 其中,I为给定实例,为给定实例I第l层特征层的分类损耗;为区域内像素点的和,为该层特征层该实例的有效区,FLl,i,j为在第l层特征层i,j位置上的焦点损耗,该焦点损耗通过2计算:FLpt=αt1-ptγlogpt2其中,焦点损耗,即focalloss,记为FLpt;pt表示不同类别的分类概率,γ为超参数指数,αt为超参数系数;步骤3.B通过式3计算回归损耗; 其中,为给定实例I第l层特征层的回归损耗,其中,IoUl,i,j为在第l层特征层i,j位置上的IoU损耗,该IoU损耗为对训练集的标准框和预测框进行对比计算,通过式4计算: 其中,Boxp为当前的标准框,Boxl为当前计算得到的预测框;式4中分子部分Boxp∩Boxl为Boxp和Boxl公共部分的面积|Boxp∪Boxl|,分母部分为Boxp和Boxl之和的面积,ln为对数函数;步骤3.B中的标准框通过对实例进行有效区和忽略区处理后,对忽略区以外的区域置0,对标准框的有效区置1得到;对有效区到忽略区之间的位置认为是灰度区域,对该区域的数据不处理;步骤3.B中的预测框基于损耗计算结果进行在线特征选择后,回传选定的最优化特征层和损耗用于下一次迭代来推理得到,具体为:对每个实例当分支取得结果后,通过求平均得到每层预测层样本的综合损耗,然后选择综合损耗最小一个预测层作为回传特征层;其中,回传特征层的综合损耗为RetinaNet有参考框分支中优化器的输入,且综合损耗最小一个预测层,即最优化特征层;预测框具体通过如下子步骤得到:步骤3.BA通过式5得到综合损耗最小的特征层: 其中,l*是选择出来进行参数回传的特征层的层数,和分别是第I个实例第l层特征层的分类损耗和回归损耗,回传的特征层表示为 其中,综合损耗最小的特征层即最优化特征层;步骤3.BB基于步骤3.BB最优化特征层的结果得到预测框坐标;步骤3.BB.1计算偏移量;具体为:对于有效区所有的像素i,j,将该层特征层标准框的映射框表示为像素i,j与四个边的距离,并设置一个标准化常数S=4,对像素i,j与四个边的距离做偏置处理,得到传送偏移量;其中,i,j为像素的横纵坐标,为标准框在第l层特征层的映射;步骤3.BB.2计算以有效区内所有像素为中心、且框大小与该层特征层映射框一致的预测框与标准框的综合损耗,并选择综合损耗最小的像素imin,jmin作为预测框的中心;步骤3.BB.3,剔除标准化常数S对偏移量的影响,得到像素距离预测框的实际距离,得到预测框在该特征层的映射左上角与右下角的坐标,再使用2l*对映射框缩放,得到原图像的预测框;其中,剔除S即传送偏移量乘以步骤3.BB.1中的标准化常数S,得到像素imax,jmax与预测框四条边的距离;步骤4、将步骤3选择的最优化特征层对应的综合损耗输入RetinaNet有参考框分支中的内部标准优化器及LookAhead优化器,使得综合损耗收敛;步骤4,具体包含以下子步骤:步骤4.1初始化外循环计数值、目标函数L、慢权重参数φ和快权重参数θ;其中,外循环计数值记为t,循环计数最大值记为tmax,初始化t=1,初始化慢权重参数φ0;步骤4.2在第t次外循环中,将外循环计数值为t-1时刻的慢权重参数φt-1赋值给初始化快速权重θ,作为标准优化器的初始参数;其中,标准优化器运行在Lookahead优化器内循环中,且在内循环中迭代次数为一个同步周期k;步骤4.3、Lookahead优化器内部的标准优化器通过式6在标准优化器内循环的第i次迭代中计算快权重:θt,i=θt,i-1+Aθt,i-1,d6其中,A为标准优化器,为标准梯度下降和随机梯度下降两种中的一种;d为当前数据的采样值;θt,i-1为标准优化器所需参数;θt,i是第t次外循环中标准优化器第i次迭代的快速权重优化结果;θt,i-1是第t次外循环中标准优化器第i-1次迭代的快速权重优化结果;步骤4.4基于步骤4.3的结果通过式7更新慢权重参数:φt=φt-1+βθt,k-φt-17其中,θt,k是第t次外循环中标准优化器第k次迭代的快速权重优化结果;φt-1是外循环计数值为t-1时刻的慢权重参数;φt是外循环计数值为t时刻的慢权重参数;β为Lookahead优化器的迭代参数;步骤4.5判断外循环计数值t是否等于循环计数最大值tmax,并决定是否完成本方法,具体为:若是,则输出t时刻的慢权重参数φt,完成优化;否则令t=t+1,跳至步骤4.2。

全文数据:

权利要求:

百度查询: 北京理工大学 基于FSAF及快-慢速权重的目标检测与识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。