买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:电子科技大学
摘要:本发明提供一种基于事件触发积分强化学习的多智能体系统人在回路弹性控制方法,属于人工智能协同控制技术领域。该方法创新性地采用基于事件触发机制的积分强化学习方法,降低智能体之间信息交流频率,减轻智能体的负担,并解决了多智能体系统在虚假输入注入攻击下的最优控制问题;除此之外,通过整合人类智能和决策,当人类操作员向非自治领导者代理发送命令信号时,系统安全性得到极大提高。
主权项:1.基于事件触发积分强化学习的多智能体系统人在回路弹性控制方法,其特征在于,包括如下步骤:S1、基于非线性多智能体系统,建立第i个跟随者的动态模型;S2、给出领导者的动力学模型,并定义局部邻域一致误差;S3、通过中值算子Med[·]过滤得到未被攻击的数据,基于未被攻击的数据得到安全预选器,并设计状态观测器;S4、构建最优性能指标函数,建立汉密尔顿-雅克比-贝尔曼方程;S5、引入事件触发机制,构建事件触发汉密尔顿-雅克比-贝尔曼方程;S6、采用积分强化学习算法求解事件触发汉密尔顿-雅克比-贝尔曼方程;S7、使用评价神经网络来估计代价函数,得到所需的近似的事件触发最优控制器。
全文数据:
权利要求:
百度查询: 电子科技大学 基于事件触发积分强化学习的多智能体系统人在回路弹性控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。