首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于YOLOv5s和阶段式正则联合行人重识别的帧提取行人检索方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京信息工程大学

摘要:本发明公开了一种基于YOLOv5s和阶段式正则联合行人重识别的帧提取行人检索方法,包括以下步骤:(1)获取扩展图像‑视频行人EIVP数据集并进行预处理;(2)构建基于YOLOv5s和阶段式正则联合行人重识别模型即YOLOv5s‑Re‑ID模型,并训练模型;(3)使用欧几里德距离计算YOLOv5s模块输出的图像与改进的Re‑ID模块输出的图像之间的相似性;本发明中改进后的行人重识别模型能够有效提高泛化能力和分类性能,降低过拟合的风险,并减少遮挡带来的影响,提高识别准确率。

主权项:1.一种基于YOLOv5s和阶段式正则联合行人重识别的帧提取行人检索方法,其特征在于,包括以下步骤:(1)获取扩展图像-视频行人EIVP数据集并进行预处理;(2)构建基于YOLOv5s和阶段式正则联合行人重识别模型即YOLOv5s-Re-ID模型,并训练模型,其中,YOLOv5s-Re-ID模型包括:YOLOv5s模块和改进的Re-ID模块;YOLOv5s模块将处理过的图像通过列表平铺传递给改进的Re-ID模块;其中,YOLOv5s模块处理过程具体如下:首先,将预处理后的待检测视频输入YOLOv5s模型中,根据设定的帧提取频率,检测出行人类别图像;其次,进行人工标注,并将其框选的行人图像存入查询集;而对于事先已标注的图像,直接放入查询集;将YOLOv5s处理后的行人类别图像和查询集共同输入到改进后的Re-ID模型中进行特征提取,并将特征传递给检测头进行目标预测;改进的Re-ID模块具体如下:改进的Re-ID模块用于提取行人图像特征,对特定行人ID进行检索,主干网络为ResNet50;其中,将基础学习率函数替换为阶段式学习率调度器,通过与热身函数相结合,在训练过程中使用多项式衰减进行学习率衰减,在后续阶段切换到余弦退火以平滑调整学习率;在ResNet50模块第3层后增加自适应表征联合注意力模块,包括:空间变换器注意块STAB和挤压和激励注意块SEAB;在ResNet50后进行调用损失函数部分,添加正则化中心损失;损失函数公式如下: ;其中,L表示总损失值,表示ID损失值,表示三元组损失值,表示正则化中心损失值,β表示正则化中心损失的平衡权重; ;其中,N表示给定的样本数量,表示真实ID标签,表示为第i个样本的预测ID逻辑数,α是一个小常数,用于鼓励模型对训练集降低信心;表示加入标签平滑之后的真实概率分布; ;其中,B是批量数量的大小,是第i个样本的特征,是第i个样本对应真实标签的中心点,表示范数的平方,λ是正则化项的权重; ;其中,、、表示每次从训练数据中取出的三幅图像,前两项为同一类,第三项为不同类,m为偏差,表示距离值始终为非负数;表示特征图对应的特征表达;自适应表征联合注意力模块用于输入的特征图进行空间变换并对每个特征通道设置权重激励;其中,STAB用于对输入的特征图进行空间变换,使网络专注于图像中的重要区域;SEAB用于对每个特征通道设置权重激励,抑制对当前任务无用的特征,除去冗余信息;(3)使用欧几里德距离计算YOLOv5s模块输出的图像与改进的Re-ID模块输出的图像之间的相似性;具体如下:根据改进后的Re-ID模型的预测结果及设定阈值,生成候选目标的边界框;根据设定的置信度阈值和距离阈值,对生成的边界框进行筛选,将最终的目标边界框相关信息输出,包括边界框的位置坐标和类别信息;最终将绘制边界框后的视频帧再次输入YOLOv5s模型中,遍历每个检测到的行人后,进行帧重组,生成已检测视频。

全文数据:

权利要求:

百度查询: 南京信息工程大学 一种基于YOLOv5s和阶段式正则联合行人重识别的帧提取行人检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。