首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于GoogLeNet的卷积神经网络行人识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京理工大学

摘要:本发明公开了一种基于GoogLeNet的卷积神经网络行人识别方法。该方法步骤如下:加载所需的工具包;定义卷积神经网络网络:定义GooLeNet神经网络模型;定义GooLeNet神经网络结构;加载VOC2007+2012数据集:标注文件夹及图片位置;生成验证和训练所需批次;进行网络检测:每张图片生成7*7个网格;网格负责预测类别信息;每个网格中的boundingbox负责预测坐标信息;生成置信度值;进行网络测试;定义模型的损失函数;加载已训练好的权重;展示图像处理结果。本发明增强了神经网络的特征表达能力,同时也提高了行人检测在夜间及复杂背景下的准确率。

主权项:1.一种基于GoogLeNet的卷积神经网络行人识别方法,其特征在于,包括以下步骤:步骤1,开始操作,加载所需的工具包;步骤2,定义卷积神经网络即定义GoogLeNet的神经网络模型及其神经网络结构;步骤3,加载VOC2007+2012数据集即标注数据集中的文件夹及图片位置,生成验证和训练所需批次;步骤4,对训练图片生成7*7网格并分别预测类别信息、坐标信息、置信度值,进行网络检测,具体步骤如下:步骤4-1、将一张图片生成网格将一张图片分成7*7个网格,物体的中心落在这个网格中此网格就负责预测这个物体;最后一层输出为7*7*2*5+1的维度,每个1*1*11的维度对应原图7*7个网格中的一个,1*1*11中含有class和boundingbox,class对应类别预测,boundingbox对应坐标预测;步骤4-2、预测boundingbox的坐标每个网格要预测2个boundingbox的坐标即X,Y,W,H,其中:中心坐标X,Y相对于对应的网格归一化到0-1之间,W,H用图像的宽度和高度归一化到0-1之间;每个boundingbox除了要回归自身的位置之外,还要附带预测一个置信度值,该置信度值代表所预测的boundingbox中含有目标的置信度和预测的准确度两重信息;如果有人工标记的物体groundtruebox落在一个网格里,第一项取1,否则取0;第二项是预测的boundingbox和实际的groundtruthbox之间的交并比IOU值;即:每个boundingbox要预测X、Y、W、H、置信度共5个值,2个boundingbox共10个值,对应1*1*11维度特征中的前10个;步骤4-3、预测class类别信息每个网格还要预测class即类别信息,官方权重中包含20个类别,现在只有person即人物一个类别;7*7的网格,每个网格要预测2个boundingbox和1个类别概率,输出就是7*7*5*2+1;即通用公式为:S*S个网格,每个网格要预测B个boundingbox还要预测C个class,输出就是S*S*5*B+C的一个张量;其中,class信息是针对每个网格的,confidence信息是针对每个boundingbox的;步骤5,进行网络测试,得到训练后的检测结果;步骤6,定义模型损失函数;步骤7,加载已训练好的权重,准备进行随机图像识别;步骤8,输出并展示图像识别效果。

全文数据:

权利要求:

百度查询: 南京理工大学 基于GoogLeNet的卷积神经网络行人识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。