一种基于改进YOLO模型的多模态行人检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江南大学

摘要：本发明涉及一种基于改进YOLO模型的多模态行人检测方法，属于深度学习目标检测领域。该基于改进YOLO模型的多模态行人检测算法，使用KAIST数据集中一一对应的可见光图片和红外光图片样本进行训练，得到训练好的模型，通过训练好的模型检测可见光‑红外光图片对中是否包含行人目标，该基于YOLO网络的多模态行人检测算法使用并行Darknet53作为特征提取网络，分别提取可见光模态和红外光模态的多尺度特征图，而且使用了加权特征融合层和CBAM注意力机制，使可见光特征和红外光特征图片更好的融合，再将多尺度注意力加权融合特征图依次级联并送入YOLO层中进行行人检测。

主权项：1.一种基于改进YOLO模型的多模态行人检测方法，其特征在于，包括如下步骤：1获得模型检测和训练所需的多模态数据；2使用两个并行的Darknet53作为特征提取网络，分别提取可见光和红外光图片的多尺度特征；3对步骤2中提取到的可见光特征和红外光特征通过模态加权融合层即MAM层进行模态加权融合，获得加权后的多模态融合特征图；所述的步骤3中，先使用1×1的卷积核对可见光特征Vi和红外光特征Ii进行维度压缩，再将其分别送入一个两层的神经网络中，第一层的参数为Vi和Ii的通道数除以16，第二层的参数为Vi和Ii的通道数，以ReLU作为激活函数；分别获得特征描述符，将特征描述符作为各模态的权重，各模态特征图乘以权重后级联，作为加权融合特征图；每个尺度的加权融合特征图为：Mi＝fcatfninVi×AvAm,fninIi×AiAm1其中，MAM层的两个输入Vnin和Inin，分别代表可见光模态和红外光模态经过NIN层压缩后的特征图，即Vnin＝fninVi，Inin＝fninIi；fnin是NIN函数，即通过1×1卷积核对特征图进行降维，完成各模态在不同通道上的信息整合；fcat是级联融合函数；模态注意力机制获得了可见光模态的特征描述符Av和红外光模态的特征描述符Ai，相加后记为Am，将两个模态的特征描述符分别除以特征描述符之和Am，作为各自模态的权重，与特征图相乘后再级联融合，作为加权融合特征图，三个尺度的加权融合特征图记为{M1,M2,M3}；4对步骤3中获得的多模态融合特征图引入包含通道注意力模块和空间注意力模块的CBAM注意力机制；5重复步骤3和步骤4，对步骤2中提取到的每个尺度的特征图都进行模态加权融合并引入CBAM注意力机制，获得多尺度的注意力加权融合特征图；6对步骤5中获得的多尺度注意力加权融合特征图上采样到同样尺度，并依次级联并送入YOLO层中；7每次选取一一对应的可见光-红外光图片对作为输入，进行训练，使用Adam优化算法迭代更新神经网络权重，在训练过程中计算损失函数，选择损失值最小的保存为最终的模型；8使用步骤7中保存的最终的模型对测试集中的图片进行检测，获得检测结果。

全文数据：

权利要求：

百度查询：江南大学一种基于改进YOLO模型的多模态行人检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种消防救援用防盗门窗破拆器

下一篇：一种具有步进调节机构的剁刀式切药机

相关技术

一种消防救援用防盗门窗破拆器

一种具有步进调节机构的剁刀式切药机

电池极耳导线焊接机构

一种专用于钣金壳体冲压成型的冲压模具

一种汽车B立柱下内腔膨胀胶

一种法兰盘焊接装置

一种空压机支架

一种制备铝箔截面的磨抛装置

一种离子迁移谱仪的校准结构

一种集成加热功能的燃料电池氢气引射器

一种具有降噪功能的数控铣床

一种移动式可调节安全通道

态相关技术

一种基于浆态床的费托合成系统及合成方法_国家能源投资集团有限责任公司_202310212765.0

一种自密式流态固化土及其回填工艺_三峡新兴管网技术有限公司_202410861439.7

一种流态固化土立式双筒搅拌机_高速铁路建造技术国家工程研究中心_202410886669.9

一种地面垂直钻井单井流态化采矿方法_中国矿业大学_202310950066.6

一种流态固化土溶洞填筑置换施工系统_深圳市居安建筑科技有限公司_202420078974.0

一种量子态调控方法、装置、量子芯片及量子计算机_山东云海国创云计算装备产业创新中心有限公司_202411035247.7

一种三重包裹胶态硫磺及其制备方法和应用_深圳市羽素生物科技有限公司_202410090420.7

一种高维纠缠态的转接装置和高维纠缠光源装置_合肥硅臻芯片技术有限公司_202322814977.4

一种黏土锂资源原矿流态化焙烧预处理装置和方法_矿冶科技集团有限公司_202410651220.4

一种在冷加工态下保持无磁特性的无磁不锈钢_山西太钢不锈钢股份有限公司_202410772193.6

多模相关技术

一种多模光交换机穿墙用转接插座_淮南文峰光电科技股份有限公司_202211011946.9

一种基于多模融合的车载对话识别方法及系统_上海弋途科技有限公司_202410982115.9

一种鞋模_福建晋江市光宇鞋模有限公司_202210742869.8

一种冲孔模_厦门驰明工贸有限公司_202323371950.9

一种用于塑料瓶压模设备的上模缓冲机构_浙江湘溪塑业股份有限公司_202311266819.8

钣金压模成型机构_昆山柏格精密机械有限公司_202323600062.X

一种注塑模_南通卡瑞尼机电科技有限公司_202410981305.9

一种翻转模切设备_安徽青藤再生资源有限公司_202323272718.X

环锻件制坯复合模工装_重庆合泰机械制造有限公司_202323584685.2

一种冲压连续模_东莞市密可沃五金科技有限公司_202323258513.6

模型相关技术

婴儿急救教学模型_河池市职业教育中心学校_202323610312.8

正常模型生成程序、正常模型生成装置及正常模型生成方法_三菱电机株式会社_202280086916.6

模型监控方法及装置_第四范式(北京)技术有限公司_202310474863.1

铁氧体材料磁化曲线模型的建立方法、模型及系统_山东得普达电机股份有限公司_202410348099.8

基于代理模型的磁悬浮轴承动力学模型的构建方法_西北工业大学_202410810241.6

基于小波网络模型的车轮磨损预测网络模型训练方法_清华大学_202210287633.X

一种火车模型_西安品竹模型设计有限公司_202323055996.X

一种新型人工肺泡模型_苏州新劢德医疗器械科技有限公司_202410659622.9

一种资源规划模型_姚胜_202322756443.0

深度神经网络模型压缩_恩智浦有限公司_202410186511.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于改进YOLO模型的多模态行人检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务