买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:云控智行科技有限公司
摘要:本发明公开网联车换道决策方法、电子设备、存储介质及计算机程序产品。方法包括:初始化蒙特卡洛树;迭代执行蒙特卡洛树搜索算法从蒙特卡洛树的根节点搜索到达蒙特卡洛树的终止节点,蒙特卡洛树搜索算法计算连线的奖励,基于强化算法根据连线的奖励计算连线的状态动作价值,并基于连线的状态动作价值值选择待选择节点;在迭代结束时,选择奖励之和最大的动作组合作为最优动作组合,向对应网联车发送最优动作组合中关于对应网联车的最优动作序列。本发明针对现有自动驾驶技术缺乏的协同合作机制,通过多车协同换道决策算法,模仿人类驾驶员的协作性,使车辆间能考虑彼此动作,提升整体交通流的协调性。
主权项:1.一种网联车换道决策方法,其特征在于,包括:每间隔预设时间间隔,进入决策时间,在每个决策时间,执行:初始化蒙特卡洛树,所述蒙特卡洛树的节点用于表示预测时间内每一预测时刻网联车集合中所有网联车的状态,连接两所述节点的连线表示执行的动作,所述动作为所述网联车集合中所有网联车执行的换道决策的换道决策组合,所述状态包括每辆网联车沿车道方向的位置、每辆网联车的所在车道和每辆网联车的车辆速度,相邻两所述预测时间之间的间隔为时间粒度;迭代执行蒙特卡洛树搜索算法从所述蒙特卡洛树的根节点搜索到达所述蒙特卡洛树的终止节点,所述根节点表示预测时间的起始预测时刻的状态,所述终止节点表示预测时间的终止预测时刻的状态,所述蒙特卡洛树搜索算法计算所述连线的奖励,基于强化算法根据所述连线的奖励计算连线的状态动作价值,并基于连线的状态动作价值值选择待选择节点;记录每次迭代中所述蒙特卡洛树中连接待选择节点的连线的动作作为每次迭代的动作组合,计算动作组合中所有动作的奖励之和,在迭代结束时,选择奖励之和最大的动作组合作为最优动作组合,向对应网联车发送所述最优动作组合中关于对应网联车的最优动作序列,所述最优动作序列包括每个预测时刻的换道决策,所述最优动作序列用于对应网联车在所述预测时刻依次执行所述最优动作序列在所述预测时刻对应的换道决策。
全文数据:
权利要求:
百度查询: 云控智行科技有限公司 网联车换道决策方法、电子设备、存储介质及计算机程序产品
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。