个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京市商汤科技开发有限公司刘宇获国家专利权

恭喜北京市商汤科技开发有限公司刘宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京市商汤科技开发有限公司申请的专利强化学习训练方法、装置、电子设备以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113469372B

龙图腾网通过国家知识产权局官网在2024-09-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110749747.7,技术领域涉及:G06N20/00;该发明授权强化学习训练方法、装置、电子设备以及存储介质是由刘宇;牛雅哲;张明;陈若冰;李楚鸣设计研发完成,并于2021-07-02向国家知识产权局提交的专利申请。

强化学习训练方法、装置、电子设备以及存储介质在说明书摘要公布了:本公开提供了一种强化学习训练方法、装置、电子设备以及存储介质,其中,该方法包括:获取目标训练任务;基于所述目标训练任务的交互环境,在预设强化学习模型中确定待训练的强化学习子模型;在容器集群中为所述目标训练任务分配计算资源,并在交互数据中确定训练数据;所述交互数据包括:与所述目标训练任务匹配的智能体,和所述交互环境的交互过程中所产生的数据;基于所述计算资源和所述训练数据,对所述强化学习子模型进行训练。

本发明授权强化学习训练方法、装置、电子设备以及存储介质在权利要求书中公布了:1.一种强化学习训练方法,其特征在于,包括:获取目标训练任务;所述目标训练任务包括任务参数;基于所述目标训练任务的任务参数所指示的交互环境,在预设强化学习模型中确定与所述交互环境匹配的待训练的强化学习子模型;在容器集群中为所述目标训练任务分配计算资源,并基于所述计算资源确定目标元数据;在交互数据队列中存储的交互数据中,查找与所述目标元数据相匹配的目标交互数据,并将所述目标交互数据作为所述训练数据,对所述强化学习子模型进行训练;所述交互数据包括:与所述目标训练任务匹配的智能体在与所述交互环境交互的过程中所产生的数据;所述目标元数据为所述交互数据的元数据,所述交互数据队列存储在所述容器集群所部署设备的设备内存中,所述交互数据队列用于对不同大小和产生频率的数据使用不同的存储介质进行传输。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京市商汤科技开发有限公司,其通讯地址为:100080 北京市海淀区北四环西路58号11层1101-1117室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。