东南大学赵池航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116994229B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310739481.7,技术领域涉及:G06V20/59;该发明授权基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法是由赵池航;邓文浩;张子怡;马欣怡设计研发完成,并于2023-06-20向国家知识产权局提交的专利申请。
本基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法在说明书摘要公布了:本发明提出了一种基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法,包括:构建货车驾驶员姿态行为标准图像数据集;构建用于货车驾驶员姿态行为感知识别的四个模型,并通过对比实验得出RetinaNet‑DPBR的性能最优;使用RetinaNet‑DPBR对标准图像数据集进行驾驶姿态行为区域裁剪与提取;构建基于卷积神经网络的货车驾驶员姿态行为识别模型VGG16‑DPBR,获取一维特征向量FV;构建基于卷积神经网络的货车驾驶员姿态行为识别模型Xception‑DPBR,获取一维特征向量FX;构建基于卷积神经网络的货车驾驶员姿态行为识别模型MobileNetV2‑DPBR,获取一维特征向量FM;将特征向量FV、FX、FM融合,构建卷积神经网络融合模型FCNN‑DPBR,可以更精准地识别货车驾驶员姿态行为,对驾驶员在驾驶途中的安全性提供一定的技术保障。
本发明授权基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法在权利要求书中公布了:1.基于卷积神经网络融合模型的货车驾驶员姿态行为识别方法,其特征在于:包括如下步骤: S1:构建货车驾驶员姿态行为标准图像数据集,有Kaggle开源数据集与SEU自制数据集; S2:构建用于货车驾驶员姿态行为感知识别的四种模型:FasterR-CNN-DPBR、SSD-DPBR、YOLOv5-DPBR、RetinaNet-DPBR,并基于构建的两个标准图像数据集和对比试验,得出最适合货车驾驶员姿态行为感知识别任务且综合性能最好的模型是RetinaNet-DPBR; S3:使用RetinaNet-DPBR模型对货车驾驶员姿态行为标准图像数据集进行裁剪与提取,获取图像当中的驾驶姿态行为区域,从而构建货车驾驶员姿态行为核心图像数据集,有KaggleCrop数据集与SEUCrop数据集; S4:构建基于卷积神经网络的货车驾驶员姿态行为识别模型VGG16-DPBR,获取一维特征向量FV; S5:构建基于卷积神经网络的货车驾驶员姿态行为识别模型Xception-DPBR,获取一维特征向量FX; S6:构建基于卷积神经网络的货车驾驶员姿态行为识别模型MobileNetV2-DPBR,获取一维特征向量FM; S7:将特征向量FV、FX、FM基于并联规则进行融合,从而构建卷积神经网络融合模型FCNN-DPBR,并对货车驾驶员姿态行为进行识别; 所述步骤S1中构建货车驾驶员姿态行为标准图像数据集的具体方法如下: S1-1:对Kaggle货车驾驶员姿态行为标准数据集而言,包含安全驾驶、左手发信息、左手打电话、右手发信息、右手打电话、操作中控台、喝水、身体向后伸、整理头发或化妆、与乘客交谈10种驾驶姿态行为类别,从原始Kaggle数据集当中每种类别图像随机抽取1500幅,涵盖20岁到60岁不同年龄段的男性驾驶员与女性驾驶员,肤色包含黄色、白色以及黑色; S1-2:对SEU货车驾驶员姿态行为标准数据集而言,包含正常驾驶、操纵变位、打电话和吃东西4种驾驶姿态行为类别,通过数据增强的方式,使每种类别图像的数量增加到400幅,涵盖20岁到60岁不同年龄段的11名男性驾驶员; S1-3:定义数据集图像当中的驾驶姿态行为区域,目的是尽量使用较少的图像信息来描述货车驾驶员姿态行为,为后续的数据标注及目标检测定位做好铺垫; S1-4:使用LabelMe软件对两个货车驾驶员姿态行为标准数据集图像当中的驾驶姿态行为区域进行标注,其中,Kaggle数据集的标签名为:{c0,c1,c2,c3,c4,c5,c6,c7,c8,c9},SEU数据集的标签名为:{Pose1,Pose2,Pose3,Pose4}; S1-5:将通过使用LabelMe软件产生的.json格式的标签文件数据集转化成标准的VOC数据集格式,格式为: ——VOCdevkit ——VOC2007 ——Annotations ——ImageSets ——Main ——JPEGImages 其中,Annotations文件夹存放.xml格式的标签文件;ImageSets文件夹下面有一个Main文件夹,其内容为数据集的划分信息;JPEGImages文件夹内存放的是原始图像数据; S1-6:各模型训练前,随机抽取图像数据按照4:1:1的比例划分训练集、验证集和测试集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励