中国科学技术大学陈宇铵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利自适应调频导航方法及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114964255B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210520352.4,技术领域涉及:G01C21/20;该发明授权自适应调频导航方法及存储介质是由陈宇铵;吉建民设计研发完成,并于2022-05-13向国家知识产权局提交的专利申请。
本自适应调频导航方法及存储介质在说明书摘要公布了:本发明的一种自适应调频导航方法及存储介质,其中方法包括以下步骤,设计与真实环境接近的机器人导航仿真器,对导航问题用半马尔科夫过程进行数学建模;用轨迹参数空间对半马尔科夫过程的动作空间进行降维;从降维后的动作空间中采样,获取大量的交互式导航经验,根据收集到的导航经验,训练最优的调频导航策略;将训练好的导航策略迁移到实体机器人。本发明的一种自适应调频导航方法使用自适应调频的导航技术,使得基于深度强化学习的导航算法能够适应更多样的环境,获得更好的泛化性。在场景复杂性较低的环境中,尽可能以低频率控制机器人,降低算法的计算开销,在场景复杂性较高的环境中,以合适的高频率控制机器人,确保其安全性。
本发明授权自适应调频导航方法及存储介质在权利要求书中公布了:1.一种自适应调频导航方法,其特征在于,包括以下步骤, 设计与真实环境接近的机器人导航仿真器,对导航问题用半马尔科夫过程进行数学建模; 用轨迹参数空间对半马尔科夫过程的动作空间进行降维,包括设计导航策略的神经网络结构,并初始化为随机策略,具体包括: 采用神经网络来表示导航策略,神经网络的结构包括前三层2D卷积和最大池化用于提取栅格图像信息,第一个卷积层为64维,3x3的卷积核和ReLU激活函数,第二个卷积层为128维,3x3的卷积核和ReLU激活函数,第三个卷积层为256维,3x3的卷积核和ReLU激活函数;其中三个最大池化层的核为2x2,步长为2;卷积层的输出经过一个全连接层后被转化为512维,然和和目标点的位置进行拼接,再经过两层512维的全连接层后得到一个2维的数据,然后经过随机采样,ELU激活函数,和轨迹参数空间中2维到3维的转换,最后得到线速度,角速度和执行时间;神经网络中的参数用xavier算法初始化,相应的初始策略为一个随机策略; 从降维后的动作空间中采样,获取大量的交互式导航经验,根据收集到的导航经验,训练最优的调频导航策略,包括在仿真器中生成一个随机的场景,根据当前的策略进行经验的采集,并用用收集到的经验对导航策略进行更新,具体包括: S2.1、设所有障碍物的位置以及机器人的起点和目标点位置都是随机设置的,机器人根据当前的策略来尝试到达目标点,在每一步机器人能会获知的自身的状态S,当前策略会产生一个相应的动作A,然后在仿真器中执行动作A后,机器人会获得一定数值的奖励R,然后到达下一个状态S’,然后不断循环,直到机器人到达目标点或者发生碰撞;在此过程中会记录下每一步的S,A,R组合,存到经验数据库中; 将三维动作空间转换为二维轨迹参数空间以进行经验存储,并将动作转换回三维以进行实际执行; 轨迹参数空间是一个二维空间,其中每个点对应一个机器人的可驱动轨迹,三维空间中的一系列机器人姿态用轨迹族参数空间中的二维流形来表示,使用一个2D虚拟动作和固定时间来定义一段参数化的圆形轨迹,称其为虚拟动作,因为和是TPspace中的虚拟平移速度和旋转速度,不受实际机器人最大平移速度和旋转速度的限制,这个虚拟2D动作转化为一个唯一的3D可执行动作,将转化为如下: ,,,其中; S2.2、重复步骤S2.1,收集满100个场景的经验以后,用这些经验对导航策略进行更新,基于分布式近端策略优化算法更新所述导航策略神经网络模型的参数; 将训练好的导航策略迁移到实体机器人。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励