基于强化学习（RL）的用于倾斜优化的奖励

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：瑞典爱立信有限公司

摘要：本申请包括用于基于强化学习RL调整针对通信网络的第一小区的一个或多个操作参数的计算机实现的方法。这样的方法包括基于在对应的多个时间点处表示第一小区中和第一小区的一个或多个相邻小区中的条件的测量值来确定多个奖励度量值。这样的方法包括基于在相继时间点处的奖励度量值之间的差来确定多个奖励值，并且将奖励值中的每个与改变一个或多个操作参数的对应的先前动作相关联。这样的方法包括选择与最高奖励值相关联的先前动作作为改变一个或多个操作参数的动作。其他实施例包括被配置为执行这样的方法的RL代理和RL系统。

主权项：1.一种用于基于强化学习RL调整针对通信网络的第一小区的一个或多个操作参数的计算机实现的方法，所述方法包括：基于在对应的多个时间点处表示所述第一小区和所述第一小区的一个或多个相邻小区中的条件的测量值来确定610多个奖励度量值；基于在相继时间点处的奖励度量值之间的差来确定620多个奖励值；将所述奖励值中的每个与改变了所述一个或多个操作参数的对应的先前动作相关联630；以及选择640与最高奖励值相关联的先前动作，作为改变针对所述第一小区的所述一个或多个操作参数的动作。

全文数据：

权利要求：

百度查询：瑞典爱立信有限公司基于强化学习（RL）的用于倾斜优化的奖励

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种风电场景下超大二维码定位识别系统及方法

下一篇：用于修复叶片根部的方法

相关技术

一种风电场景下超大二维码定位识别系统及方法

用于修复叶片根部的方法

基于FPN的复杂环境典型树木高效智能识别方法及系统

一种煤矿井下风水管路在线监测系统

一种高速公路路网级路面养护中长期规划决策方法及系统

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

订单处理方法、装置、电子设备及存储介质

一种一体式行星齿轮组减速机构

具备适应不同体型患者的呼吸内科胸腔穿刺辅助装置

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

一种铅酸电池自动组装设备及工艺

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于强化学习（RL）的用于倾斜优化的奖励

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务