Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学李雪原获国家专利权

北京理工大学李雪原获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种基于混联式分层强化学习的自动驾驶集中决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116502703B

龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310477048.0,技术领域涉及:G06N3/092;该发明授权一种基于混联式分层强化学习的自动驾驶集中决策方法是由李雪原;高鑫;刘琦;孟小强;杨帆;李子睿;栾天设计研发完成,并于2023-04-28向国家知识产权局提交的专利申请。

一种基于混联式分层强化学习的自动驾驶集中决策方法在说明书摘要公布了:本发明公开了一种基于混联式分层强化学习的自动驾驶集中决策方法,包括,构建深度强化学习网络并对深度强化学习网络进行混联式网络分层,获得上层网络和下层网络;对上层网络进行横向划分,获得横向全局策略网络和纵向全局策略网络;通过离散DRL算法进行训练,横向全局策略网络输出变道指令,纵向全局策略网络输出纵向控制策略;将下层网络划分为纵向下层网络和横向下层控制网络,通过连续DRL算法进行训练,纵向下层网络根据纵向全局策略的网络输出,选择激活对应的子策略网络并输出连续的加速度;横向下层控制网络基于最优控制规则进行变道,完成自动驾驶的集中决策。本发明进一步提高了决策的准确性、全面性和有效性。

本发明授权一种基于混联式分层强化学习的自动驾驶集中决策方法在权利要求书中公布了:1.一种基于混联式分层强化学习的自动驾驶集中决策方法,其特征在于,包括: 构建深度强化学习网络并对所述深度强化学习网络进行混联式网络分层,获得上层网络和下层网络; 对所述上层网络进行横向划分,获得横向全局策略网络和纵向全局策略网络;通过离散DRL算法进行训练,所述横向全局策略网络输出变道指令,所述纵向全局策略网络输出纵向控制策略; 将所述下层网络划分为纵向下层网络和横向下层控制网络,通过连续DRL算法进行训练,所述纵向下层网络根据所述纵向全局策略的网络输出,选择激活对应的子策略网络并输出连续的加速度;所述横向下层控制网络基于最优控制规则进行变道,完成自动驾驶的集中决策; 通过离散DRL算法进行训练,所述横向全局策略网络输出变道指令,所述纵向全局策略网络输出纵向控制策略的过程包括, 定义环境中N辆车中的M辆无人车通过与环境交互,集中决策层从环境中获取状态信息 矩阵,为车辆总特征数量; 根据不同神经网络的功能目设计状态空间,分别将所述横向全局策略网络与纵向全局 策略网络输入设计的横向全局状态空间与纵向全局状态空间, 与分别为对应网络所设计的特征数量; 所述横向全局策略网络与纵向全局策略网络获取各自信息矩阵与,通 过图卷积神经网络与多层全连接层,采纳贪婪策略分别输出变道集中决策动作,其中-1代表激活左变道规则,0代表激活维持车道规则,1 代表激活右变道规则;输出纵向集中决策动作,其中-1代表此无 人车采用减速子策略网络的输出,0代表此无人车采用调整子策略网络的输出,1代表此无 人车采用加速子策略网络的输出,其中,所述横向全局策略网络与纵向全局策略网络每Z个 时间步进行一次输出,并更新; 所述横向全局状态空间包括节点特征矩阵和邻接矩阵,将所述节 点特征矩阵与邻接矩阵输入到横向全局策略网络,利用图卷积神经网络提取场景 内车辆的拓扑结构特征; 所述节点特征矩阵包括自身车辆速度、自身车辆横向位置、自身车辆纵向位 置、无人车相邻车道前后车辆标准安全距离系数,分别为无人车右前、左前、 右后、左后车辆的系数,自身车辆所处路段、自身车辆所处车道、自身车辆所属类别; 所述节点特征矩阵的表达式为: 所述邻接矩阵用于将车辆之间的相互作用表示为车辆之间的信息共享,表达式为: 所述纵向全局状态空间包括节点特征矩阵与邻接矩阵,所述邻接矩 阵同邻接矩阵;将节点特征矩阵与邻接矩阵输入到纵向全局策略网络,利用 图卷积神经网络提取场景内车辆的拓扑结构特征; 所述节点特征矩阵包括自身车辆速度、自身车辆横向位置、自身车辆纵向位置、无人车当前车道前后车辆标准安全距离系数,分别为无人车前、后车辆的系 数,自身车辆所处路段、自身车辆所处车道、自身车辆所属类别; 所述节点特征矩阵的表达式为: 通过连续DRL算法进行训练完成自动驾驶的集中决策的过程包括, 分别将纵向下层网络的加速子策略网络、调整子策略网络与减速子策略网络输入设计 的纵向局部状态空间,为子网络所设计的特征数量; 所述加速子策略网络、调整子策略网络与减速子策略网络通过共享的纵向局部状态空 间,通过多层全连接层分别输出,,的 具体加速度值,其中,所述加速子策略网络、调整子策略网络与减速子策略网络每个时间步 都进行输出并更新。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。