Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 同济大学褚洪庆获国家专利权

同济大学褚洪庆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉同济大学申请的专利基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118790287B

龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410826646.9,技术领域涉及:B60W60/00;该发明授权基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统是由褚洪庆;于立洋;张兆思诺;黄昭彦;程一帆;高炳钊;陈虹设计研发完成,并于2024-06-25向国家知识产权局提交的专利申请。

基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统在说明书摘要公布了:本发明涉及一种基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统,其中方法包括以下步骤:建立基于生成式世界大模型的驾驶场景推理模型,预测周围交通参与者的行为,输出未来驾驶场景信息;基于未来驾驶场景信息,利用强化学习算法对智能体进行多步前瞻离线训练,得到最优价值策略网络;基于未来驾驶场景信息和最优价值策略网络,利用蒙特卡洛树搜索在线求解最优决策序列并滚动优化;建立智能网联电动汽车轨迹跟踪控制器,基于最优决策序列控制自动驾驶汽车进行实时轨迹跟踪。与现有技术相比,本发明具有能够实现自动驾驶精准决策、有效提高自动驾驶道路通过效率和安全性等优点。

本发明授权基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统在权利要求书中公布了:1.一种基于生成式世界大模型和多步强化学习的自动驾驶决策方法,其特征在于,包括以下步骤:步骤1:建立基于生成式世界大模型的驾驶场景推理模型,预测周围交通参与者的行为,输出未来驾驶场景信息;步骤2:基于未来驾驶场景信息,利用强化学习算法对智能体进行多步前瞻离线训练,得到最优价值策略网络;步骤3:基于未来驾驶场景信息和最优价值策略网络,利用蒙特卡洛树搜索在线求解最优决策序列并滚动优化;步骤4:建立智能网联电动汽车轨迹跟踪控制器,基于最优决策序列控制自动驾驶汽车进行实时轨迹跟踪;所述步骤2中,利用生成式世界大模型推理出的驾驶场景信息作为输入状态,定义驾驶决策的状态空间,即描述驾驶场景内交通参与者的状态,并定义动作空间,即可供自动驾驶系统采取的各种行动,利用采集的驾驶数据,采用多步强化学习算法进行离线训练;其中,智能体在训练过程中,根据当前状态选择行动,与环境交互并观察奖励,更新策略以最大化长期累积奖励;在多步前瞻的框架下,智能体考虑未来多个时刻的行动序列,预测未来n步内所有动作及状态转移并计算期望回报奖励,不断计算环境状态转移和动作价值概率分布,最终得到收敛后的价值策略网络;所述蒙特卡洛树搜索包括以下过程:1前瞻过程:自我车辆前瞻预设步数,其中每一步对应于固定的时间间隔T1,在每一步中,蒙特卡洛树搜索算法从当前节点的可能动作集中选择一个动作,并过渡到相应的子节点;2卷展过程:自我车辆的行为以给定的移动概率随机生成,执行卷展过程,直到达到终端状态;3终端状态:在终端状态下,计算与自我车辆采取的动作序列相关联的总成本;4反向传播:在模拟到达终端状态并计算出总成本后,将总成本通过搜索树反向传播,从叶节点开始并追溯到根节点,更新在该模拟期间遇到的每个节点的累积成本和访问计数;5重复执行过程1-4,直至达到终止条件。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。