基于逆强化学习的多模态场景驾驶行为建模方法及系统

导航：龙图腾网> 最新专利技术> 基于逆强化学习的多模态场景驾驶行为建模方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：希迪智驾(成都)科技有限公司

摘要：本发明公开了基于逆强化学习的多模态场景驾驶行为建模方法及系统，涉及智能驾驶技术领域，通过自监督对比学习算法基于模型参数对训练数据的场景进行分类，输出每个训练数据对应的场景标签。以相同场景标签的数据为一组，再次循环“逆强化学习‑场景聚类”过程，直到得到稳定的“模型参数‑训练数据”配对。使用“模型参数‑训练数据”配对训练全局代价函数，使其能根据车辆的状态判断其对应的场景并输出对应的模型参数。解决了目前将逆强化学习应用于智能驾驶中的驾驶行为建模方法由于受到线性奖励函数的限制，无法适应复杂的混编交互场景的问题。

主权项：1.基于逆强化学习的多模态场景驾驶行为建模方法，其特征在于，包括如下步骤：步骤S1、建立逆强化学习-场景聚类模型，将专家轨迹作为训练数据输入至所述逆强化学习-场景聚类模型中进行循环训练，得到模型参数-训练数据配对数据；步骤S2、构建全局代价函数，利用所述模型参数-训练数据配对数据对所述全局代价函数进行优化；步骤S3、利用优化后的全局代价函数进行场景判断，得到驾驶场景，并输出所述驾驶场景对应的模型参数；其中，所述全局代价函数包括损失函数，其中，所述损失函数表示如下：；其中，表示损失函数，表示交叉熵函数，表示对场景轨迹集合中第个数据预测的特征权重向量，表示第个场景轨迹集合对应的特征权重向量。

全文数据：

权利要求：

百度查询：希迪智驾(成都)科技有限公司基于逆强化学习的多模态场景驾驶行为建模方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种低硬度彩色天然橡胶材料及其制备方法

下一篇：一种放射性同位素碳-14标记的巴德卡鲁胺及其制备方法和应用

相关技术

一种低硬度彩色天然橡胶材料及其制备方法

一种放射性同位素碳-14标记的巴德卡鲁胺及其制备方法和应用

一种导电浆料电阻率测试装置及导电浆料电阻率测试方法

点云配准方法、装置、存储介质、计算机设备和程序产品

化合物、有机电致发光元件用材料、有机电致发光元件和电子设备

一种玻璃瓶裂纹检测装置

一种弹性卷材的放卷换卷机构

半导体用黏合膜、切割晶粒接合一体型膜及半导体装置的制造方法

大语言模型生成SQL查询语句中的数据权限控制方法及设备

叔丁醇的制造方法

一种纳米MoOx共晶体和太阳能光热发电板

绿色重楼病虫害防治方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于逆强化学习的多模态场景驾驶行为建模方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务