买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:燕山大学
摘要:本发明公开了一种基于跨模态与多尺度感知的RGB‑T人群计数方法,属于计算机视觉领域,包括:将成对的RGB和热度图像输入由SwinTransformer组成的双流网络中,提取各个模态的特定特征图;跨模态特征融合模块接收双流网络的第2,3,4阶段的输出,在各个模态间共享特征并有效去噪;多尺度特征汇聚模块接收来自跨模态特征融合模块的跨模态融合特征图,通过空间上下文感知图卷积单元建模各个尺度的人群空间结构,随后整合不同尺度的特征图;将多尺度特征汇聚模块整合的多尺度特征图送入回归头得到密度图;将密度图逐像素相加得到人群计数结果。本发明解决了跨模态特征融合过程引入噪音信息及人群分布不均匀所致的计数难题。
主权项:1.一种基于跨模态与多尺度感知的RGB-T人群计数方法,其特征在于,包括以下步骤:步骤1,将成对的RGB和热度图像输入由SwinTransformer组成的双流网络中,提取各个模态的特定特征图;步骤2,将由SwinTransformer组成的双流网络的后3个阶段提取的RGB模态和热度模态的特定特征图分别输入跨模态特征融合模块,实现在保持各个模态间共享特征的同时有效去噪,得到跨模态特征融合模块输出的跨模态融合特征图;步骤3,多尺度特征汇聚模块接收来自跨模态特征融合模块的跨模态融合特征图,通过空间上下文感知图卷积单元建模各个尺度的人群空间结构,随后整合不同尺度的特征图;步骤4,将多尺度特征汇聚模块输出的多尺度融合特征图送入回归头,经过一系列的处理,回归得到预测密度图;步骤5,将所得的预测密度图逐像素相加,得到预测总人数。
全文数据:
权利要求:
百度查询: 燕山大学 一种基于跨模态与多尺度感知的RGB-T人群计数方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。