北京理工大学孙健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于强化学习的移动机器人社交导航方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115456851B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210919201.6,技术领域涉及:G06T1/00;该发明授权一种基于强化学习的移动机器人社交导航方法是由孙健;李本帆;王钢;陈杰设计研发完成,并于2022-08-02向国家知识产权局提交的专利申请。
本一种基于强化学习的移动机器人社交导航方法在说明书摘要公布了:本发明涉及一种基于强化学习的移动机器人社交导航方法,属于强化学习技术领域,尤其涉及基于强化学习的社交导航方法。首先对社交导航问题进行建模,获取无人车状态、行人状态等时空状态信息,其次构建基于DQN的强化学习模型,模型包含四个模块:交互模块、历史特征提取模块、池化模块和规划模块。其中交互模块用于处理移动机器人与行人的交互特征,历史特征提取模块用于提取移动机器人与人群之间时间维度特征,池化模块用于将任意数量的行人输入转换为固定长度的特征向量输出,规划模块根据无人车状态及提取出来的人群特征规划出一条可行路径。最后通过对专家经验的模仿学习对模型进行预训练,加快模型收敛速度。
本发明授权一种基于强化学习的移动机器人社交导航方法在权利要求书中公布了:1.一种基于强化学习的移动机器人社交导航方法,其特征在于该方法的步骤包括: 步骤1,构建社交导航问题的模型; 步骤2,根据步骤1构建的社交导航问题的模型构建深度强化学习网络框架; 步骤3,训练步骤2构建的深度强化学习网络框架; 步骤4,将步骤3训练后的深度强化学习网络框架作为实际导航的最优策略,完成移动机器人的社交导航; 所述的步骤2中,深度强化学习网络框架包括交互模块、历史特征提取模块、池化模块和规划模块; 所述的交互模块是指根据构建的社交导航问题模型,处理无人车与人群的交互,利用多层全连接层提取移动机器人的状态特征: rt=φ1St;W1 其中,φ1为全连接层,W1为全连接层对应权重; 利用多层感知机提取每个人-机对的特征: Pt=φ2Jt;W2 利用图注意力机制计算出人群的注意力矩阵,并利用图卷积神经网络提取人群特征: At=Attention1Pt;W3 Gt=GCNAt,Pt;W4 其中,Attention1为注意力网络; 将图卷积神经网络输出特征与人-机对特征联合作为自注意力网络的输入,得到移动机器人对各个行人的注意力值: scorest=Attention2Gt,Pt;W5 其中,Attention2为自注意力网络; 利用掩码maskt对注意力值进行加权,表征当前时刻机器人与人群的空间特征: =softmaxscores×mask×[G,P] 其中,当t时刻行人状态可观测时mask为1,否则mask为0; 所述的历史特征提取模块用于提取移动机器人与人群时空图中的时间信息,将各个时刻移动机器人与人群的空间信息作为输入,得到时间特征: =LSTMw,ht-1,ct-1;W 所述的池化模块用于将任意长度的输入处理成固定长度的特征向量,采用均值池化: =Avgpoolingw,h;W 所述的规划模块用于将池化模块输出的人群特征与无人车当前状态特征作为决策网络的输入,计算各个动作的价值: =φr,c;W。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励