基于多智能体强化学习的协作推理任务调度方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东大学

摘要：本申请属于多智能体强化学习领域，具体涉及一种基于多智能体强化学习的协作推理任务调度方法，初始化多智能体环境，设置多台用户设备，每个用户设备均是一个智能体，在每个用户设备上部署独立的Actor神经网络，设置多台云端服务器并在中控服务器上部署中央Critic神经网络，并为用户设备提供多条通信通道选择，其优点在于，利用此方案来解决任务分割点、通信信道、服务器选择的组合优化问题。

主权项：1.一种基于多智能体强化学习的协作推理任务调度方法，其特征在于，包括以下步骤：S1.初始化多智能体环境，设置多台用户设备，每个用户设备均是一个智能体，在每个用户设备上部署独立的Actor神经网络，设置多台云端服务器并在中控服务器上部署中央Critic神经网络，并为用户设备提供多条通信通道选择；S2.收集多智能体环境当前状态，传入到每个Actor网络中获得输出；S3.将每个Actor网络的输出映射到决策空间，得到本次循环的决策；S4.将决策部署到多智能体环境中，得到当前决策的执行时间；S5.将决策的执行时间传入Critic神经网络，获得当前决策的得分；S6.用决策得分更新Actor网络与Critic网络；S7.重复步骤S2到S6，直到决策收敛，即决策的执行时间稳定为止。

全文数据：

权利要求：

百度查询：山东大学基于多智能体强化学习的协作推理任务调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种冷库用压力平衡装置

下一篇：一种高效线扫描光固化成像装置和方法

相关技术

一种冷库用压力平衡装置

一种高效线扫描光固化成像装置和方法

一种废弃物收集及处理系统

车辆隔板结构

卷铁心及其制造方法

基于图像分析的城市运行中流动商贩管理方法

基于额叶脑活动监测传感器的信息增强深度睡眠

显示器下方的光学生物特征成像装置中的传感器位移补偿

一种含库伦摩擦的非线性结构阻尼摄动重分析方法

一种PCB板全自动测试设备

一种SSD盘的亚健康管理与故障预测方法

一种用于通信声呐的全时间取样方法及系统

协作相关技术

应用程序协作方法、计算机可读存储介质以及应用程序协作系统_西维拉株式会社_202080089989.1

一种软件代码共享协作系统_邯郸软田科技有限公司_202410926069.0

协作式的模型训练方法及装置_南方科技大学_202110719669.6

空地协作的选择性采收视觉方法及系统_浙江工业大学_202410921562.3

一种协作机器人安装用支撑底座_山东省恒创智能装备有限公司_202323357326.3

可编程逻辑控制器的多人协作方法、装置和系统_国能智深控制技术有限公司_202410915211.1

基于多机械臂协作的复合材料铺放机器人_上海创轲新材料科技有限公司_202411180768.1

面向皮肤肿瘤图像分类的特征增强协作关系知识蒸馏方法_江苏大学_202410559104.X

以云为中心的协作和连接平台中的增量传播_辉达公司_202111294754.9

基于多智能体强化学习的协作推理任务调度方法_山东大学_202411230089.0

学习相关技术

插卡式学习设备_北京猿力未来科技有限公司_202420412892.5

学习数据生成方法、学习数据生成装置以及记录介质_松下电器(美国)知识产权公司_202380024288.3

机器学习应用的有效验证_国际商业机器公司_202010498520.5

进行机器学习以分配资源_瑞思迈数字医疗公司_202280092287.8

多通道和伴心律迁移学习_波士顿科学心脏诊断技术公司_201980079000.6

一种学习能力评估装置_河北启智教育科技有限公司_202420042533.5

用于联合学习的逐层训练_高通股份有限公司_202380026404.5

一种正姿学习支架_优象文化(广州)有限公司_202420548139.9

使用强化学习进行低秩分解来压缩深度学习模型的系统和方法_华为技术有限公司_202380012345.6

可伸缩的动态转移学习机制_国际商业机器公司_202011015479.8

推理相关技术

模型推理方法、装置、电子设备和存储介质_上海壁仞科技股份有限公司_202410834316.4

注视区域模型生成系统及推理装置_松下知识产权经营株式会社_202380023007.2

一种进行模型剪枝无损加速大语言模型推理的方法及系统_山东浪潮科学研究院有限公司_202411236951.9

一种量化神经网络推理的后处理加速方法、装置及设备_湖南长城银河科技有限公司_202411255126.3

模型训练方法、模型推理方法、装置及电子设备_上海壁仞科技股份有限公司_202410852340.0

基于多智能体强化学习的协作推理任务调度方法_山东大学_202411230089.0

基于连续学习的模型推理方法、装置及存储介质_腾讯科技(深圳)有限公司_202310390229.X

推理引擎创建方法、产品、设备及计算机可读存储介质_浪潮电子信息产业股份有限公司_202410924977.6

一种模型推理加速方法、装置、设备、介质和程序产品_蚂蚁科技集团股份有限公司_202411273650.3

一种基于强化学习的知识推理方法、装置、设备、介质和产品_阳光慧碳科技有限公司_202410679173.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多智能体强化学习的协作推理任务调度方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务