Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

包括用于生成环境中的实体之间的数据编码关系的关系网络的强化学习系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:渊慧科技有限公司

摘要:提出了一种用于强化学习的神经网络系统,包括用于从状态数据中为环境中存在或至少潜在存在的多个实体中的每个实体提取相应实体数据的输入网络。实体数据描述实体。神经网络包含用于解析该数据的关系网络,该关系网络包括一个或多个注意力块,这些注意力块可以被堆叠以对实体数据执行连续的动作。每个注意力块包括用于实体中的每一个的相应变换网络。每个实体的变换网络能够基于多个其它实体的数据,将变换网络为该实体接收的数据变换为该实体的修改后实体数据。输出网络被布置成接收由关系网络输出的数据,并使用所接收的数据来选择相应动作例如,来自可能动作的预定义空间中的动作。

主权项:1.一种用于强化学习的计算机实现的神经网络系统,其中,所述神经网络系统用于选择与环境交互的智能体要执行的动作以执行任务来试图实现指定结果,所述系统包括:输入,用于接收表征环境的状态数据,其中,状态数据包括由像素阵列定义并且包括每个像素的一个或多个值的图像数据;输入网络,用于从图像数据中为环境中潜在存在的多个实体中的每一个个实体提取指示所述实体在环境中的存在的相应实体数据,所述输入网络包括至少一个卷积层,所述至少一个卷积层被布置成从状态数据为单元阵列中的每个单元生成至少一个特征值,所述单元与环境的不同相应子集的实体相对应,所述输入网络被布置成为每个实体生成相应实体数据作为数据集,所述数据集包括与所述实体相对应的单元的至少一个特征值以及指示所述单元在单元阵列中的位置的数据;关系网络,包括至少一个注意力块,每个注意力块包括用于实体中的每一个实体的相应变换网络,每个变换网络被布置成生成用于对应实体的相应修改后实体数据,所述修改后实体数据基于用于对应的多个实体的实体数据;以及输出网络,被布置成接收由关系网络输出的数据,并使用所接收的数据来选择相应动作。

全文数据:

权利要求:

百度查询: 渊慧科技有限公司 包括用于生成环境中的实体之间的数据编码关系的关系网络的强化学习系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。