买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华南理工大学
摘要:本发明公开了基于特征提取与聚合的车载行人检测方法。所述方法包括以下步骤:输入单张图像,使用主干网络逐阶段提取图像的主干特征;提取尺度敏感特征:设计锚点步长调整策略实现自适应采样,构建多并联分支卷积块提取主干特征的多个尺度特征,通过与主干特征逐元素融合生成具备一致表征能力的尺度敏感特征;构建基于上下文增强的特征金字塔;使用区域推荐网络生成符合预设高宽比的RoIs;提取并优化RoIs特征;基于优化的RoIs特征使用检测子网络执行车载行人检测,输出分类置信度和位置坐标。本发明通过解决行人尺度变化问题,提高车载行人检测精度。
主权项:1.基于特征提取与聚合的车载行人检测方法,其特征在于,包括以下步骤:S1、输入单张图像,使用主干网络逐阶段提取图像的主干特征;S2、提取尺度敏感特征:设计锚点步长调整策略实现自适应采样,构建多并联分支卷积块提取主干特征的多个尺度特征,通过与主干特征逐元素融合生成具备一致表征能力的尺度敏感特征;S3、构建基于上下文增强的特征金字塔:提取不同空间分辨率的上下文特征,使用空间感知融合网络聚合上下文特征,为尺度敏感特征注入上下文信息,缓解通道统一造成的信息损失,构建高效特征金字塔,包括以下步骤:S3.1、基于尺度敏感特征φ'5使用比例恒定的自适应平均池化层生成多个空间分辨率的上下文特征,通过设置一组参数约束输出特征图相对于输入特征图的比例,具体如下:Ψc={λ1×R,λ2×R,…λN×R};6其中,Ψc表示N张不同分辨率的上下文特征;{λ1,…,λN}是一组恒定比例的超参数,λN表示第N张上下文特征相对于尺度敏感特征φ'5的比例;R=h×w表示尺度敏感特征φ'5的分辨率,h和w分别为尺度敏感特征φ'5的高和宽;S3.2、将N张不同分辨率的上下文特征Ψc中的每个上下文特征分别输入卷积核大小为1×1的卷积层,进行通道标准化;使用双线性插值操作将通道标准化后的上下文特征的分辨率再扩展至R,表示为C×h×w;S3.3、使用空间感知融合网络聚合上下文特征,具体算法如下:将N张分辨率扩展后的上下文特征按通道维度拼接,形成通道数是原本N倍的第一特征图,第一特征图的通道数、高和宽分别为NC、h和w;将第一特征图送入卷积核大小为1×1的卷积层,将其通道数再次降为C;将通道数降为C的第一特征图输入一个卷积核大小为3×3的卷积层和一个维度扩展函数,为N张分辨率扩展后的上下文特征生成对应的权重特征图,表示为N×1×h×w;将N张分辨率扩展后的上下文特征与对应的权重特征图逐元素相乘,得到N个加权上下文特征;将N个加权上下文特征逐元素融合,生成聚合后的上下文特征m6;S3.4、为尺度敏感特征φ'5注入不同空间分辨率的上下文信息,缓解通道统一造成的信息损失,具体如下:将主干网络的第2阶段特征φ2、第3阶段特征φ3、第4阶段特征φ4与尺度敏感特征φ'5构成的集合Φscale={φ2,φ3,φ4,φ'5}输入1×1的卷积层进行通道标准化,使各个特征层通道数保持一致,得到输出特征图M,其中M={m2,m3,m4,m5},m2,m3,m4,m5分别对应φ2,φ3,φ4,φ'5通道标准化后的特征;将聚合后的上下文特征m6与高层特征m5逐元素融合;S3.5、以一种自顶向下的方式将高层特征逐渐与低层特征融合,逐层转播特征信息,具体算法如下: 其中,α是卷积核大小为3×3的卷积核的权重参数值;表示上采样操作;p表示主干网络阶段数;mL表示主干网络的第L阶段特征φL进行通道标准化得到的特征;表示特征金字塔第L层特征,整个特征金字塔表示为S4、使用区域推荐网络生成符合预设高宽比的RoIs;S5、提取并优化RoIs特征:将RoIs映射至特征金字塔层提取固定维度的RoIs特征,使用通道感知融合网络重组RoIs特征,改善RoIs特征质量;S6、基于优化的RoIs特征使用检测子网络执行车载行人检测,输出分类置信度和位置坐标。
全文数据:
权利要求:
百度查询: 华南理工大学 基于特征提取与聚合的车载行人检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。