龙图腾网&IPTOP

微信扫码登录
账号密码登录
短信登录/注册

一种基于状态相似性和奖励经验重放的异策略学习方法

导航：龙图腾网> 最新专利技术> 一种基于状态相似性和奖励经验重放的异策略学习方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京航空航天大学

摘要：经验重放是异策略学习中一种非常重要的技术，它通过构造经验池存储智能体与环境交互得到的经验，实现对经验的多次利用，并打破了经验间的时间相关性。在以前的工作中，对经验池中所有的经验分配优先级，并在经验更新后要重新分配，这占用了大量的计算资源，需要消耗近乎原始经验重放2倍的时间。经验池中存在许多过去的经验，它们是由偏离当前策略的先前策略得到的，这对策略网络的更新是有害的。本发明介绍了一种新的经验重放优先级评定方式，设计了一套高奖励评定方法，使用状态特征的相似性和高奖励作为优先级，称为基于状态相似性和奖励的经验重放SSRER。

主权项：1.一种基于状态相似性和奖励经验重放的异策略学习方法，其特征在于：这是一种新的经验重放优先级评定方式，使用状态特征的相似性和高奖励作为优先级，并提出一种新的批生成策略，能够简单运用在任意使用演员-评论家架构的异策略强化学习算法上。

全文数据：

权利要求：

百度查询：南京航空航天大学一种基于状态相似性和奖励经验重放的异策略学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种涂装喷粉装置

下一篇：复合金属件

相关技术

一种涂装喷粉装置

复合金属件

一种储物筐可调节的电动购物车

一种电加热结构及带有该电加热结构的家用电器

一种塑胶桌布生产用收卷装置

新型弹簧球铰支座

可隐藏式转向系统

一种伸缩万向联轴器

一种框架式前防撞系统

一种分捡操作设备

军用火炮气液泵装置

一种预制菜保鲜运输箱

放相关技术

叠放设备_无锡奥特维科技股份有限公司_202010224571.9

刮板移放装置_陕煤集团神南产业发展有限公司_202420631179.X

一种自动取放设备_汉达精密电子(昆山)有限公司_202310443164.0

一种布料放卷装置_温州余兴家纺科技有限公司_202420073062.4

一种镀铝膜放卷装置_常德洛恩全息材料科技有限公司_202420569839.6

一种器械消毒架托放装置_灵山县人民医院(钦州市灵山人民医院)_202323001937.4

一种防积料放料阀_珠海奕旷新材料有限公司_202420449249.X

一种水利工程管道沉放装置_中国电建集团华东勘测设计研究院有限公司_202410982207.7

一种干燥机放料口结构_山西金万康新材料股份有限公司_202420137601.6

一种热喷涂丝材放卷装置_洛阳维航金属制品有限公司_202420513698.6

重相关技术

一种白水泥重金属含重测重方法_阿尔博波特兰(安庆)有限公司_202410858288.X

匹配文本去重方法、装置、电子设备_北京三快在线科技有限公司_202011063538.9

一种零重力缓冲器_佛山市美高卫浴有限公司_202410982753.0

一种可计重盘条送料架_中铁三局集团有限公司_202420656202.0

使用基于块的收敛加密的高效去重_亚马逊技术有限公司_202180071839.2

存储器系统内的信号重定时_美光科技公司_202410474702.7

一种车辆重识别方法及装置_深圳市捷顺科技实业股份有限公司_202110228249.8

杯重感应式防溢热水机_宁波奥富康智能科技有限公司_202323332992.1

一种网络重耕方法、装置、设备、存储介质及程序产品_中国联合网络通信集团有限公司_202410823840.1

一种重质碳酸钙生产用的粉碎装置_华钙科技(南通)有限公司_202323352802.2

异相关技术

异响定位系统、方法及电子设备_荣耀终端有限公司_202410742513.3

一种异径能源运输通道_宝武水务科技有限公司_202411227164.8

噪声响度确定方法、异响测试系统、装置及存储介质_广州汽车集团股份有限公司_202410962910.1

汽车内饰件异响仿真分析系统及分析方法_东风汽车集团股份有限公司_202110826476.0

一种抗菌复合聚异戊二烯手套的制备方法_苏州嘉乐威新材料股份有限公司_202410307088.5

一种异辛酸盐生产用污水过滤装置_江西金泰化工股份有限公司_202411147772.8

一种基于深度学习的异源遥感影像配准方法_北京数慧时空信息技术有限公司_202410866814.7

基于异网手机号的业务推荐方法及装置_中国电信股份有限公司_202010922317.6

异源影像匹配方法及装置、可读存储介质_中国铁塔股份有限公司_202410961828.7

一种耐低温异养硝化好氧反硝化菌株及其应用_太原理工大学_202411086848.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于状态相似性和奖励经验重放的异策略学习方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务