买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东科技大学
摘要:本发明属于行人检测技术领域,公开了一种基于结构重参数化的果园行人检测方法、系统、设备及介质。本发明基于改进的DINO模型搭建基于结构重参数化的目标检测网络模型。模型的骨干网络中使用了结构重参数化的方法,通过对模型结构进行重参数化操作,在模型部署阶段几乎不改变检测精度的前提下,极大缩小了网络的参数量,从而达到轻量化的目的。此外,模型的特征融合模块中引入渐进式的双向特征融合网络,融合高阶特征,以增强模型的表征能力,在模块内部对不同特征的特征图融合添加了不同的权重,以区分不同特征图的重要性。本发明还改进了模型损失函数度量,使用最小点距离损失函数进行边界框回归预测。
主权项:1.基于结构重参数化的果园行人检测方法,其特征在于,包括如下步骤:步骤1.基于改进的DINO模型搭建基于结构重参数化的目标检测网络模型;改进的DINO模型包括特征提取模块、注意力模块、特征融合模块以及Transformer模块;特征提取模块包括一个卷积层以及四个结构重参数化模块,且分别定义为结构重参数化模块一、结构重参数化模块二、结构重参数化模块三、结构重参数化模块四;四个结构重参数化模块分别由不同数量的并行多分支结构组成;Transformer模块包括位置编码层、Transformer编码器以及Transformer解码器;信号在改进的DINO模型中的处理流程如下:输入图像首先进入特征提取模块,通过卷积层进行预处理,然后使用四个结构重参数化模块对预处理后的特征图进一步特征提取,将结构重参数化模块二、结构重参数化模块三、结构重参数化模块四的特征图作为特征提取模块的输出;紧接着,将三个尺度的特征图通过注意力模块进行特征增强;特征增强后的特征图输入到特征融合模块进行多尺度特征融合,将不同通道数的特征图融合为通道数一致后,将融合后的特征图输入进Transformer模块;通过位置编码层为融合后的特征图添加位置信息,然后输入到Transformer编码器中,使用混合查询选择策略得到前K个最可能出现行人的位置,K为自然数;将得到的输出结果输入到Transformer解码器中,输出最终的边界框和预测类别;步骤2.对改进的DINO模型进行训练,将训练好的模型使用结构重参数化方法缩小特征提取模块的参数量,将并行多分支结构重参数化为单分支结构;步骤3.将结构重参数化后的模型作为最终的目标检测网络模型,进行果园行人检测。
全文数据:
权利要求:
百度查询: 山东科技大学 基于结构重参数化的果园行人检测方法、系统、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。