恭喜杭州电子科技大学杨宇翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利基于LSTM和变分自编码的移动机器人自主探索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115373380B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210387388.X,技术领域涉及:G05D1/43;该发明授权基于LSTM和变分自编码的移动机器人自主探索方法是由杨宇翔;黄佳杰;方景生;高明裕;何志伟;曾毓设计研发完成,并于2022-04-13向国家知识产权局提交的专利申请。
本基于LSTM和变分自编码的移动机器人自主探索方法在说明书摘要公布了:本发明涉及一种基于LSTM和变分自编码的移动机器人自主探索方法。采用强化学习方法通过奖励函数指导移动机器人进行自主探索到达目标位置技能的学习。利用LSTM和变分自编码分析和存储过去时刻的障碍物和移动机器人自身的状态信息以预测未来时刻的相关信息,通过强化学习的方法实现仿真环境与真实环境完成自主探索导航至目标的任务。本发明具有很高的环境适应性和探索成功率,能够在复杂环境下实现移动机器人的自主探索。
本发明授权基于LSTM和变分自编码的移动机器人自主探索方法在权利要求书中公布了:1.基于LSTM和变分自编码的移动机器人自主探索方法,其特征在于,该方法的具体步骤是:步骤1:状态空间和动作空间设定移动机器人的状态空间包括自身运动的线速度V和角速度W,以移动机器人初始位置为中心,移动机器人到达目标点时的位置g=[gx,gy],还包括移动机器人以自身位置为中心,距离目标点的距离Lgoal和方向θ,其中的Lgoal和θ是由△t内移动机器人自身的里程计位置变化计算而来的;移动机器人通过搭载2D激光雷达观测环境,观测的状态空间包括障碍物的距离Lobstacle;动作空间由线速度和角速度构成的连续动作组成;步骤2:强化学习网络构建基于长短期记忆网络和变分自编码器的TD3强化学习网络,该网络用于评估状态-动作对的Q值,网络分为如下三部分:a利用长短时记忆网络提取出状态特征首先将移动机器人的状态空间输入到长短时记忆网络中,然后将长短时记忆网络的输出hn与n时刻的输入合并后,最后输入到具有ReLU型非线性函数的一个多层感知机对状态空间进行特征提取;hn为根据n时刻的输入和n-1时刻的中间状态值hn-1产生的n时刻的状态值;b利用变分自编码器优化状态特征将步骤a特征提取的结果输入到变分自编码器中,得到输出的特征embed_state;c将特征输入TD3网络得到最佳动作TD3网络分为actor和critic两种网络;actor网络由两个全连接层组成;特征经过两个全连接层后分别通过一个ReLU激活层,最后一层通过两个动作参数a连接到输出层,这两个动作参数分别代表移动机器人的线速度a1和角速度a2;之后对输出层应用tanh激活函数,将a1和a2的值限制在-1,1的范围内;状态-动作对Qs,a由两个critic网络组成;两个critic网络结构相同,参数值存在差异;critic网络使用一对状态s和动作a作为输入;状态s经过一个全连接层L4和ReLU激活层,得到输出Ls;输出Ls和动作a分别通过两个独立的转换全连接层,其大小分别为τ1和τ2;这些层是按如下方式组合的: 其中Lc是组合全连接层,和分别为τ1和τ2的权重;是层τ2的偏差;然后把一个ReLU激活层应用于组合全连接层Lc后;之后,它通过一个代表Q值的参数连接到输出;选择两个critic网络的最小Q值作为最终输出;步骤3:设计奖励函数,训练强化学习网络;①奖励函数设计根据以下函数进行奖励: 其中,在时间步t,状态动作对st,at的奖励r取决于三个条件;如果在当前时间步Dt到目标的距离小于阈值ηD,则应用正目标奖励rg;如果检测到碰撞,则应用负碰撞奖励rc;如果这两个条件都不满足,则根据当前的线速度v,角速度w和相邻时间间隔内距离目标点的距离差dt-1-dt立即给予奖励,β为设定的系数;②为了引导导航策略朝向给定目标,采用延迟属性奖励法进行以下计算: 其中n是设定的奖励步数;③虚拟环境仿真训练和测试;步骤4:将仿真训练的结果迁移至真实移动机器人平台。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。