中国科学技术大学秦家虎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利基于深度Koopman的机器人强化学习安全控制器在线更新方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120122448B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510276494.4,技术领域涉及:G05B13/04;该发明授权基于深度Koopman的机器人强化学习安全控制器在线更新方法是由秦家虎;虞健兰;刘轻尘;马麒超;闫成真设计研发完成,并于2025-03-10向国家知识产权局提交的专利申请。
本基于深度Koopman的机器人强化学习安全控制器在线更新方法在说明书摘要公布了:本发明涉及安全强化学习技术领域,公开了一种基于深度Koopman的机器人强化学习安全控制器在线更新方法,包括:在仿真中采集随机输入控制的轨迹状态,训练深度Koopman神经网络,得到对应提升函数及演化矩阵;采用本征正交分解方法对该模型进行降维处理,获得投影矩阵及新的名义模型;在实机中进行强化学习策略迁移,交互中根据名义模型和当前观测状态得到观测误差,训练在线更新网络,得到残差矩阵;将名义模型与残差模型结合作为模型预测控制的模型约束,得到安全控制输入。本发明可以在线更新安全控制器,提升强化学习安全保障性能,适用于强化学习策略从仿真迁移到实机过程中存在模型差异、物理世界中存在扰动的动态环境等复杂情景。
本发明授权基于深度Koopman的机器人强化学习安全控制器在线更新方法在权利要求书中公布了:1.一种基于深度Koopman的机器人强化学习安全控制器在线更新方法,其特征在于,包括: 在仿真环境中随机生成机器人的控制输入序列,并采集机器人对应的状态集合; 将控制输入序列和机器人的状态集合输入深度Koopman网络进行训练,通过包含重构误差、预测误差和提升状态误差的损失函数优化深度Koopman网络参数,获得从机器人状态所在的状态空间到线性提升空间的提升函数及Koopman算子空间演化矩阵; 基于提升函数将机器人的状态映射至线性提升空间形成数据矩阵,通过降维处理得到投影矩阵及降维后的线性演化方程矩阵; 以线性演化方程矩阵为约束构建线性模型,预测控制优化问题,通过仿真调整参数,设计以安全区域平衡点为目标的安全控制器; 将离线仿真环境中的强化学习策略迁移至实际机器人作为初始策略,部署安全控制器;通过强化学习策略获得当前时间步的控制输入,机器人执行所述控制输入并与环境交互; 当安全控制器判断当前机器人状态安全时,进行强化学习策略的更新:实时采集机器人的状态,通过提升函数和投影矩阵计算机器人的观测状态,基于线性演化方程矩阵构成的名义模型预测状态误差,得到残差矩阵并更新在线名义模型; 当安全控制器判定当前机器人状态不安全时,启动安全控制器求解控制输入直至返回安全状态,再进行强化学习策略的更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励