基于策略迭代求解的机器人数据驱动控制方法和装置

导航：龙图腾网> 最新专利技术> 基于策略迭代求解的机器人数据驱动控制方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请涉及一种基于策略迭代求解的机器人数据驱动控制方法和装置。所述方法包括：根据待优化的线性增益矩阵和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题，在线性空间中，定义Q函数，通过Q函数转化，以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵，以此得到机器人动力学模型的控制策略。采用本方法能够避免引入模型误差，能够计算更优的控制策略。

主权项：1.一种基于策略迭代求解的机器人数据驱动控制方法，其特征在于，所述方法包括：根据待优化的线性增益矩阵K和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题；将控制策略u的非线性优化问题转化为高维线性优化问题为：其中，，，；所述高维线性优化问题满足高维下的模型约束为：表示的下一个状态，和均表示模型误差，均为求解所述高维特征空间的模型参数；在线性空间中，定义Q函数为：其中，，表示所述升维特征函数的简化表示，，为模型误差，表示折扣因子，表示状态值函数，k表示离散时间指针；根据所述Q函数，定义，其中，，表示升维特征函数的空间维度，表示控制策略的维度，是与相关的矩阵的向量化；以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵K，以此得到机器人动力学模型的控制策略u；以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵K，包括：定义；在第i+1次迭代时，通过最小二乘法计算的更新值为：使用所述的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学基于策略迭代求解的机器人数据驱动控制方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种宠物兽医用雾化治疗箱

下一篇：一种防护服抗穿刺测试装置

相关技术

一种宠物兽医用雾化治疗箱

一种防护服抗穿刺测试装置

一种随机数发生器芯片及量子加密装置

北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

一种磁保持继电器的安装限定结构

一种油墨储存装置

断路器系统

一种多旋翼无人机的便捷拆卸式机臂

一种提高示踪器角度测量精度的方法和系统

一种蓄电池安装架

一种汽车部品加工用固定加工台

表壳装配结构和手表

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于策略迭代求解的机器人数据驱动控制方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务