基于策略迭代求解的机器人数据驱动控制方法和装置

导航：龙图腾网> 最新专利技术> 基于策略迭代求解的机器人数据驱动控制方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本申请涉及一种基于策略迭代求解的机器人数据驱动控制方法和装置。所述方法包括：根据待优化的线性增益矩阵和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题，在线性空间中，定义Q函数，通过Q函数转化，以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵，以此得到机器人动力学模型的控制策略。采用本方法能够避免引入模型误差，能够计算更优的控制策略。

主权项：1.一种基于策略迭代求解的机器人数据驱动控制方法，其特征在于，所述方法包括：根据待优化的线性增益矩阵K和升维特征函数，构建机器人动力学模型的控制策略；所述升维特征函数是在Koopman算子框架中将机器人的原始状态空间映射到高维特征空间，以此将控制策略的非线性优化问题转化为高维线性优化问题；将控制策略u的非线性优化问题转化为高维线性优化问题为：；其中，，，，k表示离散时间指针；所述高维线性优化问题满足高维下的模型约束为：；表示的下一个状态，和均表示模型误差，均为求解所述高维特征空间的模型参数；在线性空间中，定义Q函数为：；其中，，表示所述升维特征函数的简化表示，，为模型误差，表示折扣因子，表示状态值函数；根据所述Q函数，定义，其中，表示升维特征函数的空间维度，表示控制策略的维度，是与相关的矩阵的向量化；以数据驱动方式使用的数据样本迭代计算矩阵的更新值，计算所述线性增益矩阵K，以此得到机器人动力学模型的控制策略u。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学基于策略迭代求解的机器人数据驱动控制方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种能自动弹出的抽屉式车载冰箱

下一篇：性别判定模型的生成方法、装置、电子设备及介质

相关技术

一种能自动弹出的抽屉式车载冰箱

性别判定模型的生成方法、装置、电子设备及介质

一种有效微生物群活性菌剂及其应用方法

一种消化内科催吐装置

一种鱼类产卵行为与生态水文指标响应关系量化方法

自移动设备大区域移动方法、自移动设备及存储介质

一种基于AI的纸币识别方法及纸币清分机

牙冠的宽度数值确定方法、装置、设备及存储介质

一种水中抗分散裂缝修复注浆料及其制备方法

一种基于梯度语义属性嵌入的无监督用户对齐方法

挖掘装置极限工况的结构优化方法、装置、设备及介质

机载光电设备反射镜均热化控温装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于策略迭代求解的机器人数据驱动控制方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务