Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 长春博立电子科技有限公司张立华获国家专利权

长春博立电子科技有限公司张立华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉长春博立电子科技有限公司申请的专利一种仿真环境动态更新机器人训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120850814B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511350665.X,技术领域涉及:G06F30/27;该发明授权一种仿真环境动态更新机器人训练方法是由张立华;林野;张沛轩;翟鹏设计研发完成,并于2025-09-22向国家知识产权局提交的专利申请。

一种仿真环境动态更新机器人训练方法在说明书摘要公布了:一种仿真环境动态更新机器人训练方法。涉及机器人仿真训练技术领域,具体涉及一种仿真环境动态更新机器人训练方法技术领域。本发明根据仿真环境贡献评估方法,以及仿真环境动态更新算法,对仿真环境池进行动态更新,利用动态更新后的仿真环境池对机器人仿真训练。所述方法包括如下步骤:设置仿真引擎集合;初始化仿真环境概率分布;进行环境采样;为了评估初始仿真引擎测试环境的环境贡献特征值,选取环境贡献评估参数:训练环境累计奖励函数平均值、训练环境平均生存时间、训练环境平均运行时间、跨仿真环境累计奖励函数平均值和跨仿真环境平均生存时间;计算环境贡献评分;构建环境分布更新函数;算环境概率分布。

本发明授权一种仿真环境动态更新机器人训练方法在权利要求书中公布了:1.一种仿真环境动态更新机器人训练方法,其特征在于,所述方法包括如下步骤: S1、设置仿真引擎集合,其中,表示第个仿真引擎,表示不同仿真引擎的索引值; 初始化仿真环境概率分布,其中,表示仿真步长,的取值区间为:表示最小仿真步长,表示最大仿真步长,表示当前迭代次数,,表示仿真环境迭代次数总数; S2、进行环境采样:根据,随机初始化个训练仿真环境配置; 设置当前轮次采样仿真步长集合,其中,表示第个仿真步长,表示不同仿真步长的索引值; 每个仿真环境初始化个智能体进行轮强化学习训练,,表示第轮训练; S3、选取环境贡献评估参数评估初始仿真引擎测试环境的环境贡献特征值,选取的环境贡献评估参数包括:训练环境累计奖励函数平均值、训练环境平均生存时间、训练环境平均运行时间、跨仿真环境累计奖励函数平均值和跨仿真环境平均生存时间; 所述训练环境累计奖励函数平均值的计算公式为:,其中,表示每个仿真环境下智能体的总数,表示第个智能体,表示第个生存步数,表示个智能体的生存步数总数,表示第轮中第个智能体在第步的奖励函数值,表示折扣因子,在内取值,表示第个生存步数的折扣因子; 所述训练环境平均生存时间的计算公式为:; 所述训练环境平均运行时间的计算公式为:,其中,表示个智能体训练轮的系统运行时间; 所述跨仿真环境累计奖励函数平均值的计算公式为: 其中,和分别表示训练引擎和训练仿真步长,和分别表示测试引擎和测试仿真步长,表示第轮中第个智能体在第步的测试奖励函数值; 所述跨仿真环境平均生存时间的计算公式为: ; S4、针对步骤S3选取的环境贡献评估参数,运用K邻近算法分别构建每个选取评估参数的插值模型,并采用softmax函数将每个构建的插值模型归一化到0和1之间; S5、根据步骤S4的归一化结果,计算环境贡献评分; 所述环境贡献评分的计算公式为:其中,表示第个仿真引擎在第个仿真步长的环境贡献值; 所述第个仿真引擎在第个仿真步长的环境贡献值的计算公式为: 其中,、、、和分别表示 的加权系数; S6、根据构建环境分布更新函数 表示第个仿真步长; S7、将进行归一化,计算环境概率分布, 其中,表示归一化系数; 所述归一化系数的计算式为:其中,表示在在最小仿真步长到最大仿真步长之间的积分; 所述的计算公式为:表示积分函数; S8、根据更新下一轮环境采样。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春博立电子科技有限公司,其通讯地址为:130000 吉林省长春市高新区硅谷大街3333号长春科技大市场四层4001室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。