买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于多任务深度学习的电动车骑行人员未佩戴头盔检测方法,涉及计算机视觉领域。该方法采用两个子网络,分别用于检测图像中的非机动车等占据较大区域的对象和骑行人头部区域,两个子网络共享同一个特征提取模块以及特征金字塔网络的部分层次,除此之外,两个子网络还拥有各自的输入模块和检测模块,从而可有效地避免目标大小相差悬殊对检测系统产生的影响。相对于现有技术中使用一个网络同一组权值参数检测大小差异显著的目标时所采用的方法,本发明能够大大提高对于骑行人员未佩戴头盔行为检测的准确性。
主权项:1.一种基于多任务深度学习的骑行人员未佩戴头盔行为检测方法,其特征在于,该方法包括:构建两个子网络B-Net和H-Net,两个子网络之间共享特征提取模块以及用于融合特征提取模块提取的各个层次特征的特征金字塔网络,同时两个子网络还各自具有输入模块和检测模块;待检测图像分别输入B-Net和H-Net的输入模块中,由共享的特征提取模块提取不同层级的特征图,并使用特征金字塔网络融合不同层级的特征图,再将融合特征图分别输入到B-Net和H-Net的检测模块,由B-Net的检测模块检测图像中非机动车包围框,由H-Net的检测模块检测图像中包含佩戴或未佩戴头盔两种分类类别的骑行人头部区域包围框;若非机动车包围框和被检测为未佩戴头盔的骑行人头部区域包围框之间满足预设的位置关系,则判定为该骑行人员未佩戴头盔;所述B-Net和H-Net的输入模块具有相同的结构,按数据前向传播时的数据流向,输入数据首先经过一个包含64个7×7卷积核且卷积步长为2的卷积层,卷积层后接批规范化操作和ReLU激活操作,然后再经过一个采样核大小为3×3、进行最大池化操作且步长为2的池化层,池化层之后再经过ResNet101的第1级卷积层组;所述B-Net和H-Net共享的特征提取模块包含ResNet101的第2、3和4级卷积层组,并且使用特征金字塔网络融合各个卷积层组输出的特征图;其中ResNet101的第4级卷积层组的输出特征图C4作为特征金字塔网络最顶层的输入,首先经过一个包含256个1×1卷积核且卷积步长为1的卷积层,产生特征图然后经过一个包含256个3×3卷积核且卷积步长为1的卷积层,形成特征图P4;ResNet101的第3级卷积层组的输出特征图C3在特征金字塔网络中首先经过一个包含256个1×1卷积核且卷积步长为1的卷积层,产生的特征图与经上采样操作后形成的特征图进行逐元素的求和运算,产生特征图然后经过一个包含256个3×3卷积核且卷积步长为1的卷积层,形成特征图P3;ResNet101的第2级卷积层组的输出特征图C2在特征金字塔网络中首先经过一个包含256个1×1卷积核且卷积步长为1的卷积层,产生的特征图与经上采样操作后形成的特征图进行逐元素的求和运算,产生特征图然后经过一个包含256个3×3卷积核且卷积步长为1的卷积层,形成特征图P2;所述B-Net和H-Net的检测模块具有相同的结构,该结构包括一个分类子网络和一个回归子网络;所述分类子网络包括5个卷积层,前4个卷积层具有相同的结构,均包含256个3×3大小的卷积核,卷积步长为1,且每个卷积层后接ReLU激活操作,第5个卷积层包含K×A个3×3大小的卷积核,卷积步长为1,其中K为分类类别数目,A为预设的每个点的检测框数目,最后以Sigmoid函数为每个检测框输出预测的分类类别;所述回归子网络包括5个卷积层,前4个卷积层具有相同的结构,均包含256个3×3大小的卷积核,卷积步长为1,且每个卷积层后接ReLU激活操作,第5个卷积层包含4A个3×3大小的卷积核,卷积步长为1,其中A为预设的每个点的预设检测框数目,若分类子网络预测某点m,n在第i个预设检测框检测到某类目标,其中0≤i<A,且i为整数,则回归子网络的第5个卷积层的输出特征图中,通道4i和通道4i+1的值分别代表预设检测框中心与实际检测框中心之间宽度方向和高度方向的偏移,通道4i+2和通道4i+3的值分别代表预设检测框宽度和高度与实际检测框宽度和高度的比值。
全文数据:
权利要求:
百度查询: 浙江工商大学 基于多任务深度学习的骑行人员未佩戴头盔行为检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。