买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆大学
摘要:一种基于世界模型的智能体控制方法,包括以下步骤:获取环境观测数据;利用训练数据集训练世界模型;世界模型包括变分自编码模块、序列建模模块、隐状态预测模块和优化模块;变分自编码模块用于对从重播缓冲区中采样的观测数据添加自适应高斯噪声后进行编码,生成潜在向量;序列建模模块用于根据潜在向量和智能体产生的动作向量生成隐状态;隐状态预测模块根据隐状态生成预测结果;优化模块根据隐状态预测模块的预测结果做损失优化模型参数;利用世界模型生成想象轨迹;智能体根据想象轨迹确认最优策略;本发明能够提高模型的泛化能力和鲁棒性,使智能体与世界模型的交互能够更加贴近真实环境,降低想象数据与真实环境数据的差异。
主权项:1.一种基于世界模型的智能体控制方法,其特征在于,包括以下步骤:S1:获取环境观测数据并放入重播缓冲区构建训练数据集;S2:利用所述训练数据集训练世界模型;所述世界模型包括变分自编码模块、序列建模模块、隐状态预测模块和优化模块;所述变分自编码模块用于对从重播缓冲区中采样的观测数据添加自适应高斯噪声后进行编码,生成潜在向量;所述序列建模模块用于根据潜在向量和智能体产生的动作向量生成隐状态;所述隐状态预测模块根据所述隐状态生成预测结果;所述优化模块根据所述隐状态预测模块的预测结果做损失优化模型参数;S3:利用训练好的世界模型在智能体策略集上产生想象轨迹;S4:所述智能体根据所述想象轨迹确认最优策略。
全文数据:
权利要求:
百度查询: 重庆大学 一种基于世界模型的智能体控制方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。