基于GoogLeNet的卷积神经网络行人识别方法

导航：龙图腾网> 最新专利技术> 基于GoogLeNet的卷积神经网络行人识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京理工大学

摘要：本发明公开了一种基于GoogLeNet的卷积神经网络行人识别方法。该方法步骤如下：加载所需的工具包；定义卷积神经网络网络：定义GooLeNet神经网络模型；定义GooLeNet神经网络结构；加载VOC2007+2012数据集：标注文件夹及图片位置；生成验证和训练所需批次；进行网络检测：每张图片生成7*7个网格；网格负责预测类别信息；每个网格中的boundingbox负责预测坐标信息；生成置信度值；进行网络测试；定义模型的损失函数；加载已训练好的权重；展示图像处理结果。本发明增强了神经网络的特征表达能力，同时也提高了行人检测在夜间及复杂背景下的准确率。

主权项：1.一种基于GoogLeNet的卷积神经网络行人识别方法，其特征在于，包括以下步骤：步骤1，开始操作，加载所需的工具包；步骤2，定义卷积神经网络即定义GoogLeNet的神经网络模型及其神经网络结构；步骤3，加载VOC2007+2012数据集即标注数据集中的文件夹及图片位置，生成验证和训练所需批次；步骤4，对训练图片生成7*7网格并分别预测类别信息、坐标信息、置信度值，进行网络检测，具体步骤如下：步骤4-1、将一张图片生成网格将一张图片分成7*7个网格，物体的中心落在这个网格中此网格就负责预测这个物体；最后一层输出为7*7*2*5+1的维度，每个1*1*11的维度对应原图7*7个网格中的一个，1*1*11中含有class和boundingbox，class对应类别预测，boundingbox对应坐标预测；步骤4-2、预测boundingbox的坐标每个网格要预测2个boundingbox的坐标即X，Y，W，H，其中：中心坐标X，Y相对于对应的网格归一化到0-1之间，W，H用图像的宽度和高度归一化到0-1之间；每个boundingbox除了要回归自身的位置之外，还要附带预测一个置信度值，该置信度值代表所预测的boundingbox中含有目标的置信度和预测的准确度两重信息；如果有人工标记的物体groundtruebox落在一个网格里，第一项取1，否则取0；第二项是预测的boundingbox和实际的groundtruthbox之间的交并比IOU值；即：每个boundingbox要预测X、Y、W、H、置信度共5个值，2个boundingbox共10个值，对应1*1*11维度特征中的前10个；步骤4-3、预测class类别信息每个网格还要预测class即类别信息，官方权重中包含20个类别，现在只有person即人物一个类别；7*7的网格，每个网格要预测2个boundingbox和1个类别概率，输出就是7*7*5*2+1；即通用公式为：S*S个网格，每个网格要预测B个boundingbox还要预测C个class，输出就是S*S*5*B+C的一个张量；其中，class信息是针对每个网格的，confidence信息是针对每个boundingbox的；步骤5，进行网络测试，得到训练后的检测结果；步骤6，定义模型损失函数；步骤7，加载已训练好的权重，准备进行随机图像识别；步骤8，输出并展示图像识别效果。

全文数据：

权利要求：

百度查询：南京理工大学基于GoogLeNet的卷积神经网络行人识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：多重自动光学复判系统以及多重自动光学复判方法

下一篇：一种提高采收率用纳米渗吸驱油剂

相关技术

多重自动光学复判系统以及多重自动光学复判方法

一种提高采收率用纳米渗吸驱油剂

一种扩散片的自动化生产装置及其使用方法

生产硬化钢部件的方法

一种油气勘探开发用电态势感知算法及电子设备

黏合剂组合物、电路连接用黏合剂膜及连接结构体的制造方法

用于混合动力飞行器中DC总线电压的稳定的系统与方法

一种气瓶测试装置

一种配电终端的故障诊断方法及系统

一种欠驱动无人船自适应滑模轨迹跟踪控制方法

一种安全通信方法、系统、设备和介质

一种多种方式方便打开的纸盒及其制备方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于GoogLeNet的卷积神经网络行人识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务