大连理工大学;大连理工大学宁波研究院郭烈获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学;大连理工大学宁波研究院申请的专利一种基于自适应判别器的自动驾驶决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116360429B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310229472.3,技术领域涉及:G05D1/43;该发明授权一种基于自适应判别器的自动驾驶决策方法是由郭烈;刘徐州;赵剑;余旭东;殷广;李刚设计研发完成,并于2023-03-10向国家知识产权局提交的专利申请。
本一种基于自适应判别器的自动驾驶决策方法在说明书摘要公布了:本发明公开了一种基于自适应判别器的自动驾驶决策方法,通过限制流入判别器的信息熵的体量,增加判别器的训练难度;同时,当流入判别器的信息熵体量过小时,会逐渐减弱信息流量限制,从而使得判别器所获得的信息始终保持在一个合理的水平。为了达到动态调整的目的,本发明通过采用阈值比较的方法,流入的信息熵的体量在某一阈值附近波动,阈值的选取基于统计学选取。当流入判别器的信息大于信息阈值时,损失函数会增大,更新网络时会减小通过的信息体量;而流入判别器的信息小于阈值时,这项损失不起作用,判别器为了更准确的判断数据来源,会自动提高通过的信息体量。这样即可实现动态调整的目的,解决了生成器和判别器博弈不平衡的问题。
本发明授权一种基于自适应判别器的自动驾驶决策方法在权利要求书中公布了:1.一种基于自适应判别器的自动驾驶决策方法,其特征在于:包含以下步骤:A、收集交互轨迹人类专家在真实的交通道路上驾驶试验车,根据自身经验,通过获得的信息做出判断并进行决策,与道路环境进行交互,得到人类专家交互轨迹;设生成器网络为Gx,即需要学习的决策网络;它的输入为作出决策所需要的信息,即相机拍摄的道路交通场景图片;输出为决策量,即方向盘转角和踏板角度;使用初始化的生成器网络与环境交互得到生成器网络交互轨迹;B、判断数据来源设判别器网络为Dx,判别器网络的网络结构需要根据生成器网络设计,它的输入为人类专家交互轨迹与生成器网络交互轨迹的集合,即一系列作出决策所需要的信息和根据这些信息得到的决策量的集合;它的输出为概率值,即判别器判断该输入数据来自人类专家交互轨迹的概率;C、稀释信息熵体量通过在目标函数中加入信息熵正则项稀释流入判别器的信息熵体量;将判别器网络前半部分网络结构体定义为D1x,输入x经过D1x变为z,后半部分定义为D2z;流入判别器信息熵的体量定义为M,用互信息的上界表征,即:M=∫pxKLpz|x||rzdx其中,px为输入判别器的数据的分布,rz为正态分布;信息阈值定义为I,KL即KL散度,也叫信息散度,是描述两个概率分布差异的一种度量方法;pz|x是在x确定的条件下,z的概率分布;||是KL散度公式里的符号:KLP||Q=∫PxlogPxQxdx由此得到的目标函数如下: 其中,pGx为生成器的分布,将上式写成期望的形式,得到下式: 上式中的λmaxM-I,0为实现动态调节判别器判别能力的正则项;其中表示对于Gx相关的的数据项取最大化,表示对D1x,D2z相关的数据项取最小化;p*x表示人类专家交互轨迹的概率分布,pGx表示生成器网络生成的交互轨迹的概率分布;λ为惩罚系数,表征流入信息体量超出阈值带来的损失所占的比重;D、更新网络通过上述目标函数计算损失并更新生成器网络和判别器网络,使用更新后的生成器网络和判别器网络转步骤A进行重复训练,直到判别器的识别准确率稳定在49%-51%,结束。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学;大连理工大学宁波研究院,其通讯地址为:116024 辽宁省大连市高新园区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。