Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种应用于智能终端的轻量级目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院合肥物质科学研究院

摘要:本发明公开了一种应用于智能终端的轻量级目标检测方法,包括以下步骤:1构建轻量级目标检测网络模型;2在服务器对轻量级目标检测网络模型进行训练;3训练后的轻量级目标检测网络模型部署于智能终端并实现目标检测。本发明提出的算法模型在较小的模型尺寸下提升了推理速度,并能够确保检测精度,同时解决小目标丢失问题,可以在资源受限的智能终端中实现部署应用。

主权项:1.一种应用于智能终端的轻量级目标检测方法,其特征包括如下步骤:步骤1、获取标注有目标检测框及其目标检测类别的若干张2D图像数据并进行归一化处理,从而构建训练数据集;步骤2、构建一个轻量级目标检测网络,并将所述训练数据集输入到所述轻量级目标检测网络中;所述轻量级目标检测网络包括:骨干网模块、检测头模块;其中,所述骨干网模块包括:初级特征提取模块,中间级特征提取模块,稠密连接模块;所述检测头模块包括:两个分支结构,第一分支的结构为:第一金字塔池化SPP层,第一路径聚合网络PANet,目标预选框计算模块、第一YOLOHEAD;第二分支的结构为:一个上采样层,一个张量拼接层,第二金字塔池化SPP层,第二路径聚合网络PANet,目标预选框计算模块、第二YOLOHEAD;步骤2.1所述初级特征提取模块由M个CBL块组成,分别记为CBL1,…CBLm,…,CBLM,其中,CBLm表示第m级CBL块,m=1,2,…M;所述第m级CBL块CBLm由一个二维卷积层、一个批归一化层、一个激活层组成,其中,所述第m级CBL块CBLm中二维卷积层的卷积核个数为cbl_cm个,步长为cbl_sm,卷积核大小为cbl_km×cbl_km;激活层采用的激活函数为LeakyReLU函数;所述训练数据集的图像数据输入所述初级特征提取模块中第1级CBL块CBL1后输出特征图FeatureMapCBL_1;当m=2,3,…,M时,将特征图FeatureMapCBL_m-1作为第m级CBL块CBLm的输入,并得到相应输出的特征图FeatureMapCBL_m;从而由第M级CBL块CBLM得到所述初级特征提取模块最终输出的特征图FeatureMapCBL_M;步骤2.2所述中间级特征提取模块包括N个CSP块,分别记为CSP1,…CSPn,…,CSPN;其中,CSPn表示第n级CSP块,n=1,2,…N;所述第n级CSP块由左侧分支模块、右侧分支模块、一个Concat连接层组成;其中,左侧分支模块由一个Resblock模块、一个卷积层组成;右侧分支模块由一个卷积层、一个平均池化层组成;所述第n级CSP块左侧分支模块中卷积层的卷积核个数为csp_cn个,步长为csp_sn,卷积核大小为csp_kn×csp_kn;所述第n级CSP块右侧分支模块中卷积层的卷积核个数为csp_c′n个,步长为csp_s′n,卷积核大小为csp_k′x×csp_k′x;所述特征图FeatureMapCBL_M输入所述中间级特征提取模块中第1级CSP块CSP1,并在CSP1中等分为两部分特征图,一部分特征图依次送入左侧分支模块的Resblock模块和卷积层进行计算,得到特征图FeatureMapCSP1_1;另一部分依次送入右侧分支模块卷积层和平均池化层进行计算,得到特征图FeatureMapCSP1_2;将特征图FeatureMapCSP1_1和特征图FeatureMapCSP1_2通过所述Concat连接层进行张量拼接,得到第1级CSP块CSP1最终输出的特征图FeatureMapCSP_1;当m=2,3,…,M时,将特征图FeatureMapCSP_m-1作为第m级CSP块CSPm的输入,并得到相应输出的特征图FeatureMapCSP_m;从而由第M级CSP块CSPM得到所述中间级特征提取模块最终输出的特征图FeatureMapCSP_M;步骤2.3所述稠密连接模块包括Q个Dense块,分别记为Dense1,…Denseq,…,DenseQ;其中,Denseq表示第q级Dense块,q=1,2,…Q;所述第q级Dense块Denseq由Eq个CBR模块、Fq个Transition模块组成;其中,所述CBR模块由一个卷积层、一个批归一化层和一个激活层组成;第e个CBR模块中卷积层的卷积核个数为cbr_ce个,步长为cbr_se,卷积核大小为cbr_ke×cbr_ke,e=1,2,…,Eq;CBR模块中激活层采用的激活函数为ReLU函数;所述Transition模块由一个卷积层和一个平均池化层组成;其中,第f个Transition模块中卷积层的卷积核个数为trans_cf个,步长为trans_sf,卷积核大小为trans_kf×trans_kf,f=1,2,…,Fq;所述特征图FeatureMapCSP_M输入第1级Dense块,并依次经过第1个CBR模块的卷积层、批归一化层、激活层,得到第1个CBR模块的输出特征图FeatureMapCBR_1;前e-1个CBR模块输出的特征图FeatureMapCBR_1,FeatureMapCBR_2,…,FeatureMapCBR_e-1经过张量拼接计算后作为第e个CBR模块的输入,并由第e个CBR模块输出特征图FeatureMapCBR_e;其中e=2,3,…,Eq;从而由第Eq个CBR模块输出特征图FeatureMapCBR_Eq;前Eq个CBR模块输出的特征图FeatureMapCBR_1,FeatureMapCBR_2,…,FeatureMapCBR_Eq经过张量拼接计算后作为第1个Transition模块的输入,并依次经过第1个Transition模块中的卷积层、平均池化层,得到第1个Transition模块的输出特征图FeatureMaptrans_1;前Eq个CBR模块输出的特征图FeatureMapCBR_1,FeatureMapCBR_2,…,FeatureMapCBR_Eq和前f-1个Transition模块输出的特征图FeatureMaptrans_1,FeatureMaptrans_2,…,FeatureMaptrans_f-1经过张量拼接计算后作为第f个Transition模块的输入,并由第f个Transition模块输出特征图FeatureMaptrans_f;其中f=2,3,…,Fq;从而由第Fq个Transition模块输出特征图FeatureMaptrans_Fq并作为第1级Dense模块最终输出的特征图FeatureMapDense_1;当q=2,3,…,Q时,将特征图FeatureMapDense_q-1作为第q级Denseq模块的输入,并得到相应输出的特征图FeatureMapDense_q;从而由第Q级DenseQ模块得到所述稠密连接模块最终输出的特征图FeatureMapDense_Q;步骤2.4所述特征图FeatureMapDense_Q分别送入检测头模块的第一分支和第二分支;由第一分支的金字塔池化SPP层和路径聚合网络PANet对所述特征图FeatureMapDense_Q进行处理后输出特征图FeatureMap1;所述目标预选框计算模块对训练数据集的所有目标检测框标注数据进行k-means聚类计算,输出若干个目标预选框的锚定值后与所述特征图FeatureMap1一起输入YOLOHEAD,并最终输出若干个第一目标检测结果;由第二分支中的上采样层对所述特征图FeatureMapDense_Q进行上采样处理后得到特征图FeatureMapDense_Q_upsample,然后将特征图FeatureMapDense_Q_upsample和中间级特征提取模块中第1级CSP1块输出的特征图FeatureMapCSP_1一起输入所述张量拼接层中进行张量拼接得到张量拼接结果,再将张量拼接结果依次输入至第二金字塔池化SPP层和第二路径聚合网络PANet后输出特征图FeatureMap2;所述目标预选框计算模块对训练数据集的所有目标检测框标注数据进行k-means聚类计算,输出若干个目标预选框的锚定值后,再与所述特征图FeatureMap2一起输入YOLOHEAD,并最终输若干个第二目标检测结果;步骤3、在服务器上采用随机梯度下降法对所述轻量级目标检测网络进行训练,并更新网络权重,从而生成最优轻量级目标检测网络;步骤4、将最优轻量级目标检测网络的结构、训练好的网络权重部署到智能终端上;步骤5、在所述智能终端中以实时摄像头采集的图像作为输入数据,或以本地保存的静态图片作为输入数据,并调用训练好的最优轻量级目标检测网络对所述输入数据进行前向推理计算,得到目标检测结果;且每个目标检测结果以BoundingBox,Class,ConfidenceScore三元组表示,其中,BoundingBox为检测框位置、Class为检测类别、ConfidenceScore为置信度。

全文数据:

权利要求:

百度查询: 中国科学院合肥物质科学研究院 一种应用于智能终端的轻量级目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。