恭喜南京邮电大学徐佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京邮电大学申请的专利基于多智能体强化学习的动车组视频协同缓存方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119676476B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510187523.X,技术领域涉及:H04N21/234;该发明授权基于多智能体强化学习的动车组视频协同缓存方法是由徐佳;周龙;汤耀杰;刘姝雅;李德强;刘林峰;肖甫;蒋凌云设计研发完成,并于2025-02-20向国家知识产权局提交的专利申请。
本基于多智能体强化学习的动车组视频协同缓存方法在说明书摘要公布了:本发明公开一种基于多智能体强化学习的动车组视频协同缓存方法,包括:构建动车组多车厢协同缓存视频服务系统;根据用户请求缓存命中情况,定义请求响应时间成本;根据相邻时段缓存视频内容差异,定义资源替换时间成本;形式化动车组视频服务时间成本最小化问题;调用基于多智能体强化学习的多车厢协同缓存算法,确定每个时段的视频内容缓存策略。本发明将视频内容缓存在动车组车厢上,考虑不同车厢的差异性以及线性组网的问题,设计多车厢协同缓存系统及方法,加速用户获取视频内容,提高缓存空间利用率。
本发明授权基于多智能体强化学习的动车组视频协同缓存方法在权利要求书中公布了:1.一种基于多智能体强化学习的动车组视频协同缓存方法,其特征在于,包括以下步骤:S100.构建动车组多车厢协同缓存视频服务系统,包括定义动车组车厢集合与视频内容集合,将动车组运行时间按照站点之间的行驶时间划分为时段;S200.根据用户请求缓存命中情况,定义请求响应时间成本,包括车厢内响应、车厢间响应和外部基站响应;S300.根据相邻时段缓存视频内容差异,定义资源替换时间成本;S400.形式化动车组视频服务时间成本最小化问题;S500.调用基于多智能体强化学习的多车厢协同缓存算法,确定每个时段的视频内容缓存策略,其中每个车厢被视为一个智能体,采用神经网络拟合智能体的动作,并设置两个评价网络进行协同优化;将所有智能体在时段的数据以五元组的形式存入样本池,包括全局状态、全局动作、下一时段的全局状态、奖励集合和结束标识;若样本数量达到最小批处理阈值,则对神经网络进行训练,更新目标网络参数;具体包括:S510、将每个车厢视为一个智能体,以车厢编号i表示车厢对应的智能体;采用神经网络拟合智能体i的动作,记为训练动作网络其中θi为智能体i的训练动作网络参数,对应的目标动作网络记为针对每个智能体i,设置两个训练评价网络,分别记作和其中wi,1为智能体i的第一个训练评价网络参数,对应的目标网络为而wi,2为智能体i的第二个训练评价网络参数,对应的目标网络为S520、定义每个智能体i在t时段的状态,包括在t时段车厢本身资源缓存情况、在t时段车厢内用户请求情况、车厢属性和在t时段的地点属性;记车厢属性集合为U,地点属性集合为V,则智能体i在t时段的状态表示为其中ui∈U代表智能体i所处的车厢属性,代表该智能体i当前所处的地点属性,表示车厢i缓存服务器在t时段的缓存情况,表示车厢i用户在t时段对视频内容的请求情况;S530、根据获取的智能体在t时段的状态,训练动作网络输出每个视频内容f的缓存概率;对每个视频内容f的缓存概率从大到小进行排序,选出前ci个视频内容作为最终的缓存动作;定义智能体的动作为其中,若智能体i在t时段缓存内容f,则否则,且S540、每个智能体i执行动作状态由进入下一状态环境给出奖励定义为t时段智能体i请求响应时间成本与资源替换时间成本加权和的负值,表示为: S550、将所有智能体在t时段的数据除去时间属性后以o,a,o′,r,d五元组的形式存入样本池中D,其中,表示所有智能体的局部观测状态组成的全局状态;表示所有智能体的局部动作组成的全局动作;表示下一时段的全局状态;表示奖励集合;d∈{0,1}为二元指示变量,若动车组到达终点站则d=1,否则,d=0;S560、若样本数量达到最小批处理阈值G,对神经网络进行训练,更新目标网络参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。