香港中文大学(深圳)刘杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉香港中文大学(深圳)申请的专利一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121019625B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511555348.1,技术领域涉及:B60W60/00;该发明授权一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质是由刘杨;韩善禹;余翔设计研发完成,并于2025-10-29向国家知识产权局提交的专利申请。
本一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质在说明书摘要公布了:本发明涉及机器学习与自动驾驶技术领域,公开了一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质,所述方法包括:构建与自动驾驶风险对应的广义风险函数,将广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据增广状态和所述原始状态空间构建增广状态空间,构建风险敏感驾驶策略模型,基于增广状态空间向量对风险敏感驾驶策略模型进行优化,得到目标模型;根据当前原始状态空间和当前增广状态构建当前增广状态空间向量,将当前增广状态空间向量输入到目标模型,输出控制指令,并根据控制指令完成自动驾驶控制。本发明保证决策过程的时间一致性,显著提升行车安全性,有效规避碰撞等高风险事件。
本发明授权一种基于风险敏感强化学习的自动驾驶决策方法、系统、终端及存储介质在权利要求书中公布了:1.一种基于风险敏感强化学习的自动驾驶决策方法,其特征在于,所述的基于风险敏感强化学习的自动驾驶决策方法包括: 构建与自动驾驶风险对应的广义风险函数,将所述广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据所述增广状态和所述原始状态空间构建增广状态空间向量; 构建风险敏感驾驶策略模型,基于所述增广状态空间向量对所述风险敏感驾驶策略模型进行内层动态优化,并在内层动态优化完成后进行外层静态优化,得到目标模型; 获取当前原始状态空间和当前增广状态,根据所述当前原始状态空间和所述当前增广状态构建当前增广状态空间向量,将所述当前增广状态空间向量输入到所述目标模型,输出控制指令,并根据所述控制指令完成自动驾驶控制; 所述将所述广义风险函数中累计成本的负值作为增广状态,获取自动驾驶的原始状态空间,根据所述增广状态和所述原始状态构建增广状态空间向量,具体包括: 获取所述广义风险函数中累计成本的负值,将所述广义风险函数中累计成本的负值定义为增广状态: ; 其中,表示增广状态,表示初始时刻的状态,表示当前时刻,表示初始时刻; 获取自动驾驶的原始状态空间,所述原始状态空间包括通过车辆传感器感知并融合得到的自车状态、周围交通参与者状态和道路环境状态中的至少一种; 将所述增广状态和所述原始状态空间结合,共同构成增广状态空间向量; 所述风险敏感驾驶策略模型为Actor网络和Critic网络构成的双阶段网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人香港中文大学(深圳),其通讯地址为:518172 广东省深圳市龙岗区龙城街道龙翔大道2001号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励