提升离线强化学习机器人控制准确性的方法、设备及介质

导航：龙图腾网> 最新专利技术> 提升离线强化学习机器人控制准确性的方法、设备及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种提升离线强化学习机器人控制准确性的方法、设备及介质，属机器人控制领域，方法包括：步骤1，获取包含受损数据和未受损数据的离线数据集；步骤2，利用所述离线数据集以鲁棒的变分贝叶斯推断方法对控制机器人的离线强化学习模型进行训练，直到最大化奖励的累计值；步骤3，将步骤2训练好的离线强化学习模型部署于机器人，控制机器人完成预定的操作任务。该方法贝叶斯推断框架来捕捉离线数据集中由多样化的数据受损引起的不确定性，减少受损数据对策略的负面作用，显著提高模型在干净环境中的鲁棒性和性能，也提升了离线强化学习模型所控制机器人的准确性。

主权项：1.一种提升离线强化学习机器人控制准确性的方法，其特征在于，包括：步骤1，获取包含受损数据的离线数据集；步骤2，将所述离线数据集映射到动作值函数中，以变分贝叶斯推断方法估计所述动作值函数的后验分布的不确定性数值，基于不确定性数值调整受损数据使用的权重来对控制机器人的离线强化学习模型进行训练，直到最大化奖励的累计值；步骤3，将步骤2训练好的离线强化学习模型部署于机器人，控制机器人完成预定的操作任务。

全文数据：

权利要求：

百度查询：中国科学技术大学提升离线强化学习机器人控制准确性的方法、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可调扭矩电动扳手

下一篇：一种颌骨矫治装置

相关技术

一种可调扭矩电动扳手

一种颌骨矫治装置

一种倾斜折板精馏柱

一种用于液冷板焊接的压紧装置、焊接系统及焊接方法

货厢和车辆

一种高强韧性风电轴承钢及制法、用途和一种风电轴承

一种冷凝器组装生产平台

一种基于三元深度共熔溶剂的化学-生物耦联催化生物质合成糠胺的方法及其应用

一种天然气比例掺氢配比设备

用于发光二极管芯片的互连

一种主骨切台及收料装置

一种马铃薯渣制备饲料用混合装置及其加工方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

提升离线强化学习机器人控制准确性的方法、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务