Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学庄伟超获国家专利权

东南大学庄伟超获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种自动驾驶商用车学习型紧急避撞控制方法、系统和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119953360B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510222937.1,技术领域涉及:B60W30/09;该发明授权一种自动驾驶商用车学习型紧急避撞控制方法、系统和存储介质是由庄伟超;童非凡;刘冉;李兵兵;殷国栋;许恩永;郑伟光;张志武设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。

一种自动驾驶商用车学习型紧急避撞控制方法、系统和存储介质在说明书摘要公布了:本发明公开一种自动驾驶商用车学习型紧急避撞控制方法、系统和存储介质。该方法包括:基于软演员评论家架构构建强化学习网络模型,针对商用车驾驶任务及控制动作构建对应的贝叶斯策略网络,并扩展衰减专家经验的重放缓冲区,从而产生适应紧急避撞工况的联合控制策略;车辆将贝叶斯策略网络产生的连续控制动作应用于驾驶决策任务中,以高速情况下无碰撞的避撞任务为目标,在奖励函数的指导下进行自动驾驶。本发明方法利用贝叶斯策略网络与衰减专家经验指导技术,实现自动驾驶商用车紧急避撞控制的学习效率与驾驶策略改善,有利于解决自动驾驶商用车存在的安全性方面的长尾问题,助力自动驾驶商用车应用推广。

本发明授权一种自动驾驶商用车学习型紧急避撞控制方法、系统和存储介质在权利要求书中公布了:1.一种自动驾驶商用车学习型紧急避撞控制方法,其特征在于,所述方法包括以下步骤: 步骤1:采集人类驾驶员驾驶数据,构建专家经验数据集,将专家经验数据集以衰减比例的形式加入到重放缓冲区; 步骤2:基于软演员评论家架构构建强化学习网络模型,所述强化学习网络模型包括策略网络、价值网络和Q值网络,由策略网络基于传感器的观测数据产生连续的驾驶动作,价值网络与Q值网络对策略网络产生的驾驶动作进行评估;策略网络、价值网络和Q值网络通过利用重放缓冲区的观测-动作对进行训练,更新相应的网络参数; 步骤3:基于步骤2中搭建的强化学习网络模型,针对商用车驾驶任务及控制动作构建对应的贝叶斯策略网络,对步骤2中的策略网络结构及网络更新过程进行扩展,产生适应紧急避撞工况的联合控制策略;贝叶斯策略网络的结点集合分别是转向δk、油门ak和制动brk三个动作的策略; 步骤4:将贝叶斯策略网络产生的驾驶动作应用于车辆的驾驶任务中,并通过与驾驶环境交互,以高速情况下无碰撞的避撞任务为目标,在奖励函数的指导下进行模型训练以产生最优策略; 贝叶斯策略网络输出驾驶动作的策略T=tii∈I描述为由加速控制策略ta、转向控制策略tδ以及制动控制策略tbr三个子策略动作概率πT按下述关系组成的联合概率函数: πTtδ,ta,tbr=π1taπ2tδ|taπ3tbr|ta; 所述贝叶斯策略网络采用的联合控制策略为: 式中,A是策略π的联合动作分布,是每个子策略πi的动作空间,θi是相应的参数; 所述价值网络使用下式中的价值函数VAt,s评估联合控制策略的表现: 其中,πAt|s;θ是状态s下采取动作At的概率,qs,At;ω是状态s下采取动作At的预期回报,θ、ω是相应的网络参数; 通过下式计算相应参数的梯度下降: 联合控制策略使用下式的目标函数JVπ计算值以最大化子策略πi的奖励rst,At与熵之和: 其中,α是用于控制熵正则化项权重的超参数; 在软策略迭代的评估过程中,从任意函数Q开始迭代计算软Q值,并重复应用修改后的贝尔曼备份算子更新子策略的软价值函数,贝尔曼备份算子由下式给出: 在每个子策略的改进步骤中,对每个时刻的状态根据下式更新相应的策略: 其中,是旧策略动作价值函数,是归一化因子; 在每次子策略迭代中,软策略评估与软策略改进交替执行以保证子策略组合之间的最优最大熵收敛。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210000 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。