基于大语言模型的自动驾驶多模态感知决策方法及装置

导航：龙图腾网> 最新专利技术> 基于大语言模型的自动驾驶多模态感知决策方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京化工大学

摘要：本申请提供基于大语言模型的自动驾驶多模态感知决策方法及装置，感知决策方法包括：获取当前时刻的目标区域的RGB图像和红外图像；利用目标检测模型对RGB图像进行处理，得到目标框以及对应的目标检测类别；利用分割模型对红外图像和目标框以及对应的目标检测类别进行处理得到目标掩码图像；利用融合模型对RGB图像、目标掩码图像和红外图像进行融合得到融合特征图；利用大视觉语言模型对表征用户意图的第一prompt信息、表征目标检测类别优先级的第二prompt信息以及融合特征图进行融合处理得到文本信息；利用自然语言大模型对文本信息进行处理得到感知决策结果。本申请提高了交通参与者在自动驾驶车辆感知决策的优先级，提升了自动驾驶车辆的安全性。

主权项：1.一种基于大语言模型的自动驾驶多模态感知决策方法，其特征在于，包括：获取当前时刻的目标区域的RGB图像和红外图像；利用目标检测模型对所述RGB图像进行处理，得到目标框以及对应的目标检测类别；利用分割模型对红外图像和目标框以及对应的目标检测类别进行处理，得到目标掩码图像；利用融合模型对所述RGB图像、所述目标掩码图像和所述红外图像进行融合，得到融合特征图；利用大视觉语言模型对表征用户意图的第一prompt信息、表征目标检测类别优先级的第二prompt信息以及所述融合特征图进行融合处理，得到文本信息；利用自然语言大模型对所述文本信息进行处理，得到感知决策结果；所述分割模型包括图像编码器，提示编码器和掩码解码器；利用分割模型对红外图像和目标框以及对应的目标检测类别进行处理，得到目标掩码图像，包括：利用所述图像编码器对所述红外图像进行处理，得到图像嵌入特征；利用所述提示编码器对目标框以及对应的目标检测类别进行处理，得到提示嵌入特征；利用所述掩码解码器对所述图像嵌入特征和提示嵌入特征进行处理，得到包含掩码和语义标签的目标掩码图像；所述融合模型包括：第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层和加法单元；利用融合模型对所述RGB图像、所述目标掩码图像和所述红外图像进行融合，得到融合特征图，包括：利用所述第一卷积层对所述红外图像进行处理，得到第一特征图；利用所述第二卷积层对所述目标掩码图像进行处理，得到第二特征图；利用所述第三卷积层对所述RGB图像进行处理，得到第三特征图；利用所述第四卷积层对第一特征图、第二特征图和第三特征图进行处理，得到第四特征图；利用所述第五卷积层对第四特征图进行处理，得到第五特征图；利用所述第六卷积层对第五特征图进行处理，得到第六特征图；利用所述第七卷积层对对所述RGB图像、所述目标掩码图像和所述红外图像进行处理，得到第七特征图；利用所述加法单元对第六特征图和第七特征图进行相加，得到融合特征图。

全文数据：

权利要求：

百度查询：北京化工大学基于大语言模型的自动驾驶多模态感知决策方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种饮料澄清过滤装置

下一篇：FCRN抗体及其使用方法

相关技术

一种饮料澄清过滤装置

FCRN抗体及其使用方法

紧密世界空间包围区域的生成

基于动态正交子空间的质量相关微小故障检测方法

低温容器装置

一种带自动锁闭口盖的脱插整流罩结构

一种激光直写纸基多通道LIG传感器的制备方法及其应用

一种功能化壳聚糖基复合气凝胶、制备方法和用途

用结合于191P4D12蛋白的抗体药物偶联物(ADC)治疗非肌肉浸润性膀胱癌(NMIBC)的方法

一种喷涂及余高打磨机器人

一种市政施工给水排污管道组件

β-微管蛋白作为筛选防治Didymella segeticola的杀菌剂作用靶标、作用机制及其应用

态相关技术

一种混合压缩态光场生成装置_西安工业大学_202420378230.0

一种三态车锁系统_公安海警学院_201810332473.X

一种具有交换流态的防堵塞潜流人工湿地_重庆市三峡生态环境技术创新中心有限公司_202420012028.6

一种双光子双态发光卟啉荧光染料及其制备方法_湖南科技大学_202410662960.8

量子体系下的热化态制备方法、设备及存储介质_腾讯科技(深圳)有限公司_202111479010.4

一种缺陷态氧化镁催化剂及其制备方法与应用_南京大学_202410663752.X

基于连续谱束缚态超表面的光谱成像方法_北京理工大学_202410685968.6

基于锰铁价态调控的改性活性焦及其制备方法_华北水利水电大学_202310676780.0

一种再生红砖粗骨料基大流态混凝土的制备工艺_菏泽城建绿源环保科技有限公司_202311317808.8

一种铸态下含钼的耐磨高铬铸铁材料及其制备方法_扬州禄昌恒泰航空新材料有限公司_202410824514.2

多模相关技术

一种预应力桩模具一模多桩的分隔装置及多桩制作方法_建华建材(中国)有限公司_202410907520.4

一种基于深度学习的多模光纤散斑图像重构方法_上海理工大学_202410845318.3

一种非刚性多模医学图像的配准方法及系统_华中科技大学_202111192744.4

一种多工位自动换模系统及其控制方法_裕钦精密拉深技术(苏州)有限公司_202411128222.1

天平式硫化机中心机构及多模硫化机_青岛海琅智能装备有限公司_201910924579.3

混凝土侧模的连接组件及混凝土侧模_中国建筑第二工程局有限公司_202420010504.0

薄壁筒件拉延模_昆山创恒精密模具有限公司_202323413844.2

共模滤波器_TDK株式会社_202110665797.7

筒仓顶板吊模装置_河北省第四建筑工程有限公司_202323412241.0

一种多功能多件飞机旋翼桨毂冲切压校型锻压复合模_中信戴卡股份有限公司_202420574150.2

驾驶相关技术

驾驶训练辅助装置_韶关学院_202420069439.9

驾驶辅助装置_丰田自动车株式会社_202111220957.3

自动驾驶辅助装置_株式会社斯巴鲁_201910428735.7

无人驾驶矿车并列式驾驶模式控制系统及方法_内蒙古北方重型汽车股份有限公司_202410679932.7

车辆驾驶预警方法和装置_腾讯科技(深圳)有限公司_202010301446.3

一种远程驾驶摄像系统_东风悦享科技有限公司_202211446029.3

高级辅助驾驶算法迭代方法_安徽江淮汽车集团股份有限公司_202410830186.7

一种适用自动或准自动驾驶或辅助驾驶的智能控制交通系统_杨州曼_202310249830.7

用于工程机械的自动驾驶系统、工程机械及自动驾驶程序_神钢建机株式会社_202380020174.1

一种驾驶室后窗开闭装置_山东金利智能科技有限公司_202420271990.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于大语言模型的自动驾驶多模态感知决策方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务