Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京空间飞行器总体设计部李剑飞获国家专利权

北京空间飞行器总体设计部李剑飞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京空间飞行器总体设计部申请的专利单机任务场景信息获取及单智能体运动控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115457424B

龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210938616.8,技术领域涉及:G06V20/40;该发明授权单机任务场景信息获取及单智能体运动控制方法是由李剑飞;李群智;马超;田健;危清清设计研发完成,并于2022-08-05向国家知识产权局提交的专利申请。

单机任务场景信息获取及单智能体运动控制方法在说明书摘要公布了:本发明提供了一种单机任务场景信息获取及单智能体运动控制方法,单机任务场景信息获取方法能够实现针对复杂动态环境,获取信息作为智能策略的输入和训练基础;单智能体运动控制方法采用针对动态少样本任务条件的机器人操作高效率强化学习策略,有效解决机器人操作学习任务的对象模拟、策略生成、任务泛化以及经验迁移的全流程问题。本发明研究适用于单机任务场景下的智能感知数据的图像拍摄和数据采集技术,并将获取的信息作为可供深度学习训练使用的训练数据库,有效的服务于机器人感知系统。本发明的单智能体运动控制方法,采用单智能体运动控制策略,基于深度强化学习方法研究机械臂抓取不同目标技术,可直接支撑未来的智能空间机器人。

本发明授权单机任务场景信息获取及单智能体运动控制方法在权利要求书中公布了:1.一种单智能体运动控制方法,其特征在于,采用一种单机任务场景信息获取方法进行信息获取;所述单机任务场景信息获取方法包括如下步骤: 步骤1,通过运动目标检测,在视频或图像序列中将感兴趣的运动目标与背景分离,获得运动目标的位置信息,提取出的目标对象; 步骤2,对目标的特征进行分析,并确定该目标在视频图像序列中的位置,记录目标质心的位置并计算出运动目标的轨迹; 步骤3,基于HOG特征和SVM分类,通过学习阶段与检测阶段,实现对目标的识别,完成单机任务场景信息获取;学习阶段包括如下步骤:采集正、负样本数据;提取样本的特征信息到特征向量空间中,用向量模型表示图像的特征信息,得到特征向量;将特征向量输入到分类器中训练学习,生成目标分类器;检测阶段包括如下步骤:在目标检测的基础上,对检测窗口图像进行特征提取;得到目标特征向量后输入到训练好的目标分类器上,通过检测窗口扫描对目标进行分类,并用矩形框标识;对输出结果进行矩形框合并,将重叠在一起的小矩形合并成一个大矩形框,实现对目标的识别; 其中,HOG特征是检测到的局部对象轮廓能够被光强梯度或边缘方向的分布所表征; 所述单智能体运动控制方法包括:将获取到的信息作为运动控制的输入,采用单智能体运动控制策略,基于深度强化学习方法控制机械臂抓取不同目标; 包括如下步骤: 步骤31,构建包括六自由度机械臂物理模型、运动的待抓捕目标和周围环境物理属性的仿真环境;机械臂的传感器信息通过插件形式加入仿真环境,并通过可视化的方式进行显示; 步骤32,拟合关节模型;其中,在物理机械臂装配前,采集每个关节的输入端控制力矩和关节端力矩传感器的数据,训练一个全连接网络进行逼近;神经网络模型拟合了关节的电机、模型、减速器模型以及摩擦模型; 步骤33,将待抓捕目标的位置、接触摩擦、接触刚度以及接触阻尼参数进行高斯随机化处理,随机化的各参数期望值为真实世界的标称值,并去掉不符合物理意义的负值;待抓捕目标初始在机械臂的工作空间外,以直线或自由落体的方式穿过机械臂的工作空间,其射入的方向、位置以及速度进行给定区间内的随机化处理; 步骤34,使用深度强化学习算法中的PPO算法训练控制器动作空间选为各关节的力矩: 状态空间选为目标的坐标、机械臂末端的坐标、关节角度和角速度: 设计奖励函数为: 其中,λii=1,2,3表示奖励函数各部分所占的权重,通过调节λi的相对大小来控制各个指标的相对重要程度,同时对所消耗的能量进行限制;x1,y1,z1表示笛卡尔坐标系下待抓捕目标的三维坐标值,x,y,z表示机械臂末端的坐标值;E表示机械臂当前时刻消耗的能量,使用6个电机的转速和输出转矩乘积的和来表示;为采样时间,为最大仿真时间,第3项表示抓捕时间越长,负奖赏越大; 步骤35,在仿真环境中开展训练,直到累计奖赏函数达到要求值或者达到最大训练周期数量; 步骤36,将训练好的整个算法部分迁移到实际的机械臂控制板上,采用仿真环境下机械臂的初始状态作为控制器的输入,运动目标检测算法和跟踪算法部署在另一块控制板上,配置好相机系统,转换到与仿真环境中一致的坐标系,将目标位置计算结果传送给机械臂控制器,通过机械臂控制器实现对单智能体的运动控制。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京空间飞行器总体设计部,其通讯地址为:100094 北京市海淀区友谊路104号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。