一种矿区车辆应急引导方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中煤科工智能储装技术有限公司

摘要：本发明涉及一种矿区车辆应急引导方法，包括：多个无人机作为空中调度指挥中心，每个无人机配备用于识别车辆和障碍物的摄像装置和用于引导车辆运行的语音广播装置，以及用于自身位置的定位系统。无人机接收到应急指挥命令后，无人机根据模型的输出实时导航接近任务车俩，到达位置后通过机载摄像机进行对车辆识别，和后台数据库比对成功后播报指挥语音，指挥引导车辆到达目的地。本发明采用集中式的以智能体为中心的反事实基线来实现反事实的多智能体策略梯度中的信用分配，通过“试错”的方式与环境持续交互，用以训练无人机，使无人机的导航达到最优策略，有效的减少车辆在矿区中的运行时间，提高了工作效率，特别是在发生事故时起到关键性作用。

主权项：1.一种矿区车辆应急引导方法，所述方法所使用的系统包括：位于地面的调度服务器、多架无人机，所述的无人机上设有摄像装置、语音提示装置和定位装置，其特征在于，所述方法的步骤包括：步骤1，现场数据采集：采集三维矿区场景，构建仿真环境，并将仿真环境参数初始化；步骤2，构建无人机运动模型：定义无人机的动作空间，定义环境的状态空间，引入评价指标地理公平性以保证无人机能供公平的为所有待引导车辆提供指挥引领服务，寻求目标是多个无人机在有限的续航时间内规避地面障碍物的影响，合理分配任务，以安全高效的引导更多车辆到达指定位置；步骤3，模型训练：构建集中式训练分散式执行的学习框架，其中使用联合信息训练的Critic网络来更新Actor-Critic架构中的一组独立Actor网络，学习一个集中的价值函数来估计所有智能体的预期折扣奖励；模型训练包括如下子步骤：子步骤1：引入残差自注意力RSA在集中式评估网络中引入残差自注意力RSA模块以处理可变数量的无人机，实体编码器在通过注意力层之前将不同的观测空间视为实体映射到嵌入空间，无人机的观测结果首先使用全连接层嵌入，对每个无人机的观测嵌入进行归一化处理，然后使用全连接网络进一步嵌入到查询Q，键K，值V中，其中Q代表需要获取信息的请求、Key表示与Q相关性的衡量标准、V表示需要被提取信息的实际数据；将Q，K和V输入到一个缩放的点积多头注意力中；将原始观测嵌入处理与处理后的嵌入相加后进行归一化，并平均得到的嵌入值，以形成固定大小的嵌入值；子步骤2：设定环境初始状态为st0：无人机u从当前时刻t的局部环境中获取观测包括无人机k的剩余能量当前位置Cut＝{xt,yt,zt}和操作状态待引导车辆i的位置Ci＝{xi,yi,zi}，x、y、z表示矿区空间的笛卡尔坐标系；矿区障碍物j的位置Cj＝{xj,yj,zj}以及引导目的地的位置Gd；多个无人机合理分配任务，并通过轨迹规划规避障碍物，以最高效率尽可能指挥更多待引导车辆到达指定目的地；子步骤3,：定义多架无人机的预期折扣奖励rt为：其中：表示无人机到达第i个待引导车辆位置获得的奖励，表示无人机指挥车辆到达目的地获得的奖励，表示无人机u的初始能量值，Eut表示无人机的剩余能量值，I表示待引导车辆的集合；U表示无人机的集合；εu表示无人机u的惩罚因子；ft表示地理公平性：其中：αti表示待引导车辆i在t时刻是否获得指引；子步骤4：观测空间编码：为了在每个时刻t处理可能发生数量变化的无人机，首先对所有存活的无人机k的观测空间进行编码，然后将编码通过RSA模块传递；因此，Critic网络的输出，即集中式状态函数可以表示为：其中：gk·表示存活无人机k的观测空间所对应的编码函数；φ表示Critic网络的参数；表示Critic网络的状态价值函数；子步骤5：对Critic网络进行训练更新其中： γ表示折扣因子；λ表示平衡因子，取值在0到1之间；Gt表示t时刻的累计折扣奖励；T表示任务时间；γt-1表示t时刻的折扣因子；rt+1表示表示t时刻获得的奖励；λt-1表示t时刻的平衡因子；γT表示T时刻的折扣因子；y表示累计期望奖励；子步骤6：计算存活无人机k的优势函数：假设每架无人机的观测值和观测-动作对是不同的实体，通过学习一个值函数来学习无人机的反事实基线，该值函数以所有无人机的观测-动作对为输入；通过使用RSA模块以及观测-动作对编码器，设置第k架无人机的基线为：其中：θ表示Actor网络的参数；fk`表示观测-动作对的编码网络；k`表示其他存活无人机；Qθ表示Actor网络参数为θ时第k架无人机的基线表示，即动作价值函数；表示其他存活无人机k`在时刻t的观测值；ak`表示其他存活无人机k`在时刻t采取的行为；存活无人机k的优势函数计算为：其中：Advk表示存活无人机k的优势函数；子步骤7：对Actor网络进行训练更新：Jθ＝Advk2其中：Jθ表示Actor网络参数θ的更新函数；步骤4，指挥车辆运行：多架无人机接收到应急指挥命令后，获取待引导的任务车辆的位置，利用上述模型进行任务分配和轨迹规划，每架无人机根据策略网络的输出实时导航接近待引导车俩，到达位置后通过机载摄像机对待引导车辆进行识别，和后台数据库比对成功后播报指挥语音，指挥引导车辆到达目的地。

全文数据：

权利要求：

百度查询：中煤科工智能储装技术有限公司一种矿区车辆应急引导方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种髋臼盂唇切除器

下一篇：一种带有杂质预处理结构的反渗透净水设备

相关技术

一种髋臼盂唇切除器

一种带有杂质预处理结构的反渗透净水设备

一种人工智能保洁机器人防撞结构

一种空压机变频装置

一种无人机提取设备

一种磨损小的滚珠轴承

一种安全防滑型踏步板

一种合金钢带修磨装置

一种用于半导体芯片制造的镀膜机

一种防爆应急疏散指示灯

一种按摩梳

一种水利河道拦污防汛装置

车辆相关技术

车辆用座椅及车辆_株式会社泰极爱思_202410346003.4

车辆_丰田自动车株式会社_202410196826.3

车辆用减振器及车辆_舍弗勒技术股份两合公司_201910585092.7

车辆_丰田自动车株式会社_202410312593.9

车辆、车辆的控制方法和车辆控制接口盒_丰田自动车株式会社_202410320089.3

车辆控制方法、装置、车辆及介质_长城汽车股份有限公司_202410807408.3

车辆的副车架及车辆_浙江吉利控股集团有限公司_202411202708.5

车辆控制装置以及车辆控制方法_丰田自动车株式会社_202111392941.0

用于车辆的天幕结构和车辆_长城汽车股份有限公司_202410828021.6

夹持机构、车辆扶手装置和车辆_梅赛德斯-奔驰集团股份公司_202410980217.7

矿区相关技术

一种矿区车辆应急引导方法_中煤科工智能储装技术有限公司_202410692134.8

一种矿区车辆运输可视化的安全监控设备_中国非金属材料南京矿山工程有限公司_202311745453.2

一种基于多源数据融合的矿区生态修复工程评价系统_湖南省自然资源事务中心_202410878869.X

一种矿区无人驾驶推土机的挡土墙边缘智能报警方法及系统_华中科技大学_202410861700.3

煤矿区域防尘控制系统_徐州江煤科技有限公司_202410757897.6

高寒矿区冻土生态治理系统_广东中煤地质生态环境有限公司_202420523126.6

一种基于热红外成像技术的矿区水害识别方法及系统_中铁十九局集团矿业投资有限公司_202410737646.1

一种煤矿区测绘用三维激光扫描仪_高唐县恒诚建筑工程有限公司_202323628694.7

一种矿区植被生长介质层的构建方法_美丽华夏生态环境科技有限公司_202410737295.4

一种矿区空气环境的监测装置_中国电建集团华东勘测设计研究院有限公司_202323514622.X

方法相关技术

DAI配置方法、指示方法、发送方法、装置及介质_OPPO广东移动通信有限公司_202310133314.8

显示方法、查询方法、导航方法、辅助乘车方法及装置_阿里巴巴集团控股有限公司_202010178368.2

封装方法_法国圣戈班玻璃厂_202410826928.9

一种数据压缩方法、解压方法、位宽确定方法和系统_网易(杭州)网络有限公司_202410842860.3

成本测算方法、确定方法、装置、设备、介质及产品_广汽丰田汽车有限公司_202410916022.6

电极构件及其制造方法、电池构件及其制造方法、以及电池的制造方法_三井金属矿业株式会社_202380022373.6

问答模型训练方法、文本处理方法及奖励模型训练方法_恒生电子股份有限公司_202410779372.2

内存扩展方法、内存访问方法、装置及系统_山东浪潮科学研究院有限公司_202410582247.2

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410979222.6

工件台测试方法、平面光栅测试方法及系统测试方法_北京华卓精科科技股份有限公司_202111597212.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种矿区车辆应急引导方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务