Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京易锐思科技有限公司张海获国家专利权

恭喜南京易锐思科技有限公司张海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京易锐思科技有限公司申请的专利一种基于知识蒸馏和多智能体强化学习的智能控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119126577B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411621384.9,技术领域涉及:G05B13/04;该发明授权一种基于知识蒸馏和多智能体强化学习的智能控制方法是由张海设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。

一种基于知识蒸馏和多智能体强化学习的智能控制方法在说明书摘要公布了:本发明公开了一种基于知识蒸馏和多智能体强化学习的智能控制方法,包括以下步骤:通过环境监控智能体对传感器设备获取的环境参数进行图结构化编码建模;通过决策与协调智能体基于环境监控智能体的输出,使用因果关系模型对各类环境变量进行分析,挖掘环境变化与设备控制之间的因果关系;基于多智能体强化学习的方法,提升决策与协调智能体的自主决策能力与协同控制;基于分布式原型知识蒸馏,提升决策与协调智能体在边缘设备上的学习与推理能力;本方法具有在动态环境中提高响应速度、逐步提升整体控制性能和精度,从而实现自适应调整,优化设备运行并减少能耗的特点。

本发明授权一种基于知识蒸馏和多智能体强化学习的智能控制方法在权利要求书中公布了:1.一种基于知识蒸馏和多智能体强化学习的智能控制方法,其特征在于,包括以下步骤:S1,通过环境监控智能体对传感器设备获取的环境参数进行图结构化编码建模;S2,通过决策与协调智能体基于环境监控智能体的输出,使用因果关系模型对各类环境变量进行分析,挖掘环境变化与设备控制之间的因果关系;S3,基于多智能体强化学习的方法,提升决策与协调智能体的自主决策能力与协同控制;S4,基于分布式原型知识蒸馏,提升决策与协调智能体在边缘设备上的学习与推理能力;S1包括步骤:S101,将环境参数形式化记作[Type,Date,Loc,Tem,Hum],其中表示当前环境的类型,Date表示时间,Loc表示经纬度坐标,Tem表示温度,Hum表示湿度;S102,对于上述环境参数分别进行特征初始化,对于环境类型使用由1×1卷积组成的嵌入层将其映射至一个d维的环境类型特征向量,表达式为: ;对于时间参数,采用正余弦相结合的方式生成时间特征向量,表达式为: ;其中,表示不同的时间单位,表示对应的周期长度;对于经纬度坐标Loc先进行离散化操作,并通过1×1卷积组成的嵌入层将特征转换为d维的坐标向量,表达式为: ;其中,和分别表示经度坐标和纬度坐标,和分别表示经纬度坐标的个数;对于温度Tem和湿度Hum直接通过1×1卷积组成的嵌入层进行特征映射,生成温度特征向量和湿度特征向量,表达式: ;S103,使用图生成网络对于S102中的参数向量进行图结构化建模,图生成网络将环境类型向量作为图的中心点,并通过可变的注意力机制DA计算中心点与其余参数向量间的相关性,构建环境参数关系图S,表达式为: , ;其中,,表示不同的环境参数特征,W表示网络学习的权重矩阵,k表示环境类型特征向量特征维度索引,该索引共有d个,表示相对于的数学期望,MLP表示多层感知机;S104,根据环境类型的不同,环境监控智能体将环境参数关系图S分为不同的环境域,通过跨域聚类后的特征组群,识别不同环境中共享或相似的特征,表达式为: ;其中,表示均值聚类算法,表示拉普拉斯矩阵的特征向量,I表示单位矩阵,D表示度矩阵,表示基于不同的环境域构建的相似度矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京易锐思科技有限公司,其通讯地址为:210012 江苏省南京市雨花台区凤信路6号6栋4层-027;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。