Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学李星海获国家专利权

大连理工大学李星海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学申请的专利一种基于动态动作的随机决策变换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120409604B

龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510300293.3,技术领域涉及:G06N3/092;该发明授权一种基于动态动作的随机决策变换方法是由李星海;金博;刘寨义;魏小鹏设计研发完成,并于2025-03-14向国家知识产权局提交的专利申请。

一种基于动态动作的随机决策变换方法在说明书摘要公布了:本发明公开了一种基于动态动作的随机决策变换方法,包括:构建离线环境数据集,Critic网络模型,模型πθθ,上下文长度,最大迭代次数,期望损失参数,最大决策动作数量候选回报值,通过预训练随机性网络和多动作输出模型训练获得最优策略。达到在自动驾驶环境中帮助车辆评估当前交通环境的复杂程度,让模型的动作空间尽可能地广,选择出最优的动作,找到最优驾驶策略的目的。

本发明授权一种基于动态动作的随机决策变换方法在权利要求书中公布了:1.一种基于动态动作的随机决策变换方法,其特征在于,包括: S1:创建输入参数; S2:预训练随机性网络; S3:多动作输出模型训练; S4:随机性网络根据当前的状态和动作给出下一个状态和奖励的标准高斯分布,通过比较估计值和实际值来计算不确定性,并将这种不确定性传递给DecisionTransformer,同时估计的奖励值会作为回报值的惩罚项来进行微调,最终决策树模型利用不确定性确定最终生成的动作数量,Critic网络来评估最终的动作以做出最优选择; S4-1:给定环境初始状态,初始化动作数量,循环执行对于每次迭代i从1到n个候选奖励,每个候选奖励采样出若干动作对,结束n次迭代,获得最优动作; S4-2:计算环境的不确定性,更新动作数量,环境执行最优动作,推进环境得到下一个时刻的状态和奖励,最后输出结果为真结束循环,使用训练好的模型对新输入的离线环境数据集D进行处理,动态生成最优驾驶策略; 步骤S1创建输入参数具体方法包括:离线环境数据集D,网络Q函数,随机初始化参数的DecisionTransformer模型,上下文长度K,最大迭代次数T,期望损失参数,最大决策动作数量,n个候选回报值; 离线环境数据集D包括:天气、路况和交通参与者行为; 天气包括:晴天、雨天、雪天、雾天、阴天; 路况:高速公路、城市道路、乡村道路、山路、施工区域; 交通参与者行为:行人过马路、自行车骑行、车辆变道、车辆超车、紧急刹车; 步骤S2预训练随机性网络具体方法包括: S2-1:数据处理; 将天气、路况和交通参与者行为数据转换为状态、动作、奖励值样本,具体步骤包括: 状态值:根据天气、路况和交通参与者行为的组合生成,具体组合形式为:晴天+城市道路+行人过马路; 动作值:车辆在当前状态下的决策动作,具体动作为:减速、变道、停车; 奖励值:评估动作的效果,具体效果为:安全性避免碰撞、效率节省时间; S2-2:随机性网络模型构建、训练与优化; 对于每次迭代i从1到T,从离线环境数据集D中采样一批样本集合,根据公式: 获得下一个时刻的高斯分布,式中表示状态和动作下的均值,表示状态和动作下的标准差,最小化损失函数优化随机性网络,公式为: 其中,损失函数分为两个部分,第一部分表示模型预测的均值,表示真实值;第二部分为正则化参数项,其中,表示样本的数量,表示输出的维度数量,每个样本j有M个特征,是模型对于第个样本的第k个特征的预测均值,参数为是真实值,即目标值;是与方差相关的超参数,分别表示方差的上限和下限;表示以自然数为底的指数函数,最后通过最小化损失函数优化随机性网络,结束迭代。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116000 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。