买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽理工大学
摘要:本发明属于计算机视觉领域,提供了一种基于时间域信息传递的视频目标检测方法,包括以下步骤:1获取并输入视频数据;2对视频帧进行分成每m一组;3通过信息传递模块,首先对每一组连续帧进行合并,获取特征并通过门控循环单元实现上下文信息的传递;4利用YOLOV5对数据进行后续检测,使用FocalLoss交叉熵损失与DIoULoss函数训练此模型。与现有的技术相比,本发明基于YOLOV5模型对其进行了改进使其更注重连续帧中相邻帧的信息,可以有效提升目标检测的质量。
主权项:1.一种基于时间域信息传递的视频目标检测方法,其特征在于,该方法包括以下步骤:1输入视频数据;2对视频中的帧数据进行剪切分组,分为相邻的m帧;3.1将多帧视频数据按照每相邻m帧分为一组,对于每组数据进行合并为一帧,在对其进行Focus切片操作,再将切片后的图像进行卷积核大小为3×3的卷积操作;3.2步骤3.1中生成的特征h输入到GRU单元进行相邻帧之间的信息传递,其中包括一个重置门控r和一个更新门控z, 其中σ是sigmoid函数,xt是当前节点的输入,ht-1是上一个传输下来的状态,Wr和Wz分别是重置门和更新门的权重;得到门控信号之后,首先使用重置门控来得到重置之后的数据ht-1′,再将ht-1′与输入xt进行拼接,在通过一个tanh激活函数来将数据放缩到-1~1的范围内,最终得到h′, ht-1′=ht-1⊙r,4其中W为权重,⊙为同或运算;3通过信息传递机制从相邻帧中获取信息增强对当前帧的检测;4.1将经过信息传递后的特征yt依次经过CSP1_1操作、CBL操作和CSP1_2操作得到所输入图像的第一特征,如下式所示,Y=CPSCBLytwhereCBL=Conv+BN+ReLU,5其中CSP表示特征融合;4.2将得到的第一特征再经过式5得到输入特征的第二特征;4.3将得到的第二特征依次经过CBL操作、SPP操作、CSP2_1操作得到输入特征的第三特征;4.4将得到的第三特征经过上采样操作并与第二特征进行Concat拼接操作再一次经过CSP2_1操作、CBL操作得到输入特征的第四特征;4.5将得到的第四特征进行上采样操作并与第一特征进行Concat拼接操作再经过CSP2_1操作得到输入特征的第五特征,对第五特征进行Conv卷积操作得到第六特征图,如下式所示,Y′=FConcat,CSP,Conv,6其中F函数表示特征提取,Concate表示拼接;4.6将得到的第六特征输入式6得到第七特征图;4.7将得到的第七特征通过式6得到第八特征完成目标检测与目标选框;4利用YOLOV5模型对处理后的帧数据进一步检测,得到检测结果;5.1输出端对获得的第九特征进行目标BoundingBox的损失函数计算,采用DIoU的方式进行极大值抑制;5.2对于分类产生的损失采用FocalLoss交叉熵损失函数,FLpt=-1-ptγlogpt,7其中1-pt为可变平衡因子,γ为调节因子且大于零;5.3对于位置回归产生的损失采用DIoULoss损失函数, 其中ρ表示预测框和真实框中心点的距离,p和g是两个框的中心点,c表示两个框的最小包围框的对角线长度。
全文数据:
权利要求:
百度查询: 安徽理工大学 一种基于时间域信息传递的视频目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。