上海大学望前程获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海大学申请的专利一种基于深度强化学习的TACS网络资源分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116405904B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310358415.5,技术领域涉及:H04W4/42;该发明授权一种基于深度强化学习的TACS网络资源分配方法是由望前程;赵恒凯;郑国莘设计研发完成,并于2023-04-06向国家知识产权局提交的专利申请。
本一种基于深度强化学习的TACS网络资源分配方法在说明书摘要公布了:本发明涉及一种基于深度强化学习的TACS网络资源分配方法,包括如下步骤:针对列车自主运行系统构建隧道环境下的通信场景,并为所述通信场景内的通信业务划分信令优先级;在对所述通信场景中列车与列车间通信链路的最大时延进行约束的前提下,以列车自主运行系统吞吐量最大化为目标,构建多智能体深度强化学习模型;使用基于深度学习拟合、注意力机制和优先经验回放的深度确定性策略梯度算法对所述多智能体深度强化学习模型进行训练;基于训练好的多智能体深度强化学习模型,获取最佳动作策略,基于所述最佳动作策略实现网络资源的分配。与现有技术相比,本发明有效提高了TACS系统的总容量以及降低了T2T链路的传输时延。
本发明授权一种基于深度强化学习的TACS网络资源分配方法在权利要求书中公布了:1.一种基于深度强化学习的TACS网络资源分配方法,其特征在于,包括如下步骤:针对列车自主运行系统构建隧道环境下的通信场景,并为所述通信场景内的通信业务划分信令优先级;在对所述通信场景中列车与列车间通信链路的最大时延进行约束的前提下,以列车自主运行系统吞吐量最大化为目标,构建多智能体深度强化学习模型;使用基于深度学习拟合、注意力机制和优先经验回放的深度确定性策略梯度算法对所述多智能体深度强化学习模型进行训练;基于训练好的多智能体深度强化学习模型,获取最佳动作策略,基于所述最佳动作策略实现网络资源的分配,所述的多智能体深度强化学习模型的构建过程包括如下步骤:将每个列车与列车间的通信链路作为智能体,各个智能体在状态空间中获取一个状态,并对应地在动作空间中采取一个动作,根据策略进行网络资源的分配,其中,所述策略由表示智能体在某一状态的情况下执行某一动作的概率动作价值函数确定;各个智能体通过与通信场景交互以获得奖励,用以确定下一个新的状态时选择执行的动作,其中,所述奖励基于列车与列车间通信链路和列车与轨旁间通信链路的容量,以及列车与列车间通信链路的时延获取,所述的奖励采用下式获取: ,其中,为列车与列车间通信链路的最大时延,、、为权重,为传输所用的时间,为第个列车与轨旁间通信链路的信道容量,为第个列车与列车间通信链路的信道容量,、分别为列车与轨旁间通信链路数量和列车与列车间通信链路数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学,其通讯地址为:200444 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。