恭喜重庆大学产业技术研究院;张涛;重庆瞰图科技有限公司张涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜重庆大学产业技术研究院;张涛;重庆瞰图科技有限公司申请的专利一种基于深度强化学习的施工场地监控布置方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119849888B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510329424.0,技术领域涉及:G06Q10/0631;该发明授权一种基于深度强化学习的施工场地监控布置方法是由张涛;闫辰骞;刘书其;张璇;曹一;李龙;刘文彬;周浩设计研发完成,并于2025-03-20向国家知识产权局提交的专利申请。
本一种基于深度强化学习的施工场地监控布置方法在说明书摘要公布了:本发明公开了一种基于深度强化学习的施工场地监控布置方法,涉及模型应用技术领域。本发明中监控布置建模为多智能体强化学习模型的设计,通过多智能体的深度强化学习,经过共同目标的引导,促使各智能体以协同和自适应的方式行动,最终实现施工场地监控的智能布置;且本发明提出的基于深度强化学习的施工场地监控智能布置方法,能够高效自动化地进行监控布置设计,相较于传统的人工经验和固定规则方法,能够显著提高布置效率与精度,通过将监控设备视为智能体进行联合优化,能够实现全局协调与自适应布置,避免了人工方法带来的不灵活和低效问题,提高监控布置效率与精度。
本发明授权一种基于深度强化学习的施工场地监控布置方法在权利要求书中公布了:1.一种基于深度强化学习的施工场地监控布置方法,其特征在于:至少包括以下步骤:S1:将监控布置问题建模为多智能体强化学习模型,将每个监控都作为一个智能体,即称为监控-智能体,每个监控-智能体在施工场地自由自动,监控-智能体之间是相互合作的关系,监控-智能体之间相互配合,来实现监控覆盖的全面化,以及成本的最小化,最终决定自己的位置;进行监控布置建模的计算过程至少包括以下步骤:将监控布置问题从一个平面设计问题转化为一个随着时间变化和环境变化进行路径规划的问题;此时数学模型符合多智能体强化学习的数学建模原则;随着每个监控-智能体i在根据当前状态和当前时间步t进行一个动作,环境根据当前的状态和动作反馈一个新的状态和奖励;针对每个智能体,其目标为最大化期望的累计奖励,如式(1)所示: ,其中,是折扣因子,取0.99,用来表示未来奖励的当前价值;N表示监控-智能体的个数;S2:搭建基于深度强化学习的监控-智能体,通过深度强化学习和共同目标的引导,促使各智能体以协同和自适应的方式行动,最终实现施工场地监控的智能布置;所述监控-智能体的深度强化学习的至少包括监控-智能体的动作、监控-智能体的观察内容和监控-智能体的奖励;所述监控-智能体的动作中每个智能体输出的动作格式是相同的,即;其中,表示监控i的类型,表示监控i在平面中位置,表示监控i的高度,表示监控i的朝向,需要注意的是,为离散动作,其动作列表为;其中,表示第m个监控设备类型,0则表示此智能体失效,即在场地中不布置此监控;通过将0作为备选方案,使得算法不仅能够决策智能体的位置还能决策智能体的个数,使得设计结果更加灵活和多样;此外,为了监控提高智能体神经网络的泛化能力以及加快收敛速度,将这四个参数的动作空间设计为连续动作,且放缩至;所述监控-智能体的观察内容至少包括以下内容:监控布置的不能超过施工区域的边界,因此每个智能体需要观察到施工区域的边界,即,其中,表示第k个施工区域边界坐标点;每个监控-智能体需要观察施工结构的区域,即 ,其中,表示第m个工程结构的第q边界点的x坐标;每个监控-智能体i需要观察到自己的型号,观察的范围,以及所在的平面位置,高度以及朝向角度,即; 表示监控i能够观察的角度,是监控i的固有属性;表示监控i在平面中位置;表示监控i的高度;表示监控i的朝向;每个监控-智能体i需要观察到其他智能体的位置以及参数,即 ;所述监控-智能体的奖励为环境对监控布置的反馈;监控-智能体获得的奖励引导着智能体向更优的位置进行移动,同时促使智能体选择更适合自己的设备类型,此外,由于监控-智能体的目标为共同目标,不存在相互竞争的关系,因此将全局的奖励作为每个监控-智能体的奖励;当然智能体的奖励设置需要考虑多方面的考虑,如式(2)所示,其中,和表示不同因素的权重,由设计师确定或经过实验调整确定: ,其中,是监控的覆盖奖励,用来引导智能体覆盖更多的区域,如式(3)所示: , 是监控覆盖的面积,是场地的面积; 是监控的设备购置奖励,引导智能体使用更少的设备购置费用,如式(4)所示: , 表示第i个设备的购置费用,N表示所有设备的个数; 是监控的安装施工奖励,引导智能体使用更少的安装施工费用,如式(5)所示: ,其中,N表示所有设备的个数,即设备个数越少安装施工费用越少; 表示设备的种类个数,即设备的种类越少安装的复杂程度越小,即费用越少;S3:搭建基于注意力机制的智能体网络架构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学产业技术研究院;张涛;重庆瞰图科技有限公司,其通讯地址为:401331 重庆市沙坪坝区大学城南一路263号5幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。