首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多任务强化学习的流固耦合系统控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南开大学

摘要:本发明涉及计算机图形学流体动力学模拟领域,尤其是一种基于多任务强化学习的流固耦合系统控制方法,包括基于元强化学习方法,训练通用的控制器,生成指定模拟环境和目标下的动画,本发明提出了一个统一的强化学习框架来实现可迁移多任务流体控制,通过元学习的方法来编码模拟器的信息,实现了控制算法在不同模拟器之间的迁移,避免重复训练带来的大量消耗。同时结合新的任务表示,实现了多任务控制,实现了在模拟环境和任务目标两个方面的可迁移性,用户可以方便地调节模拟器参数或者任意指定目标,并且可以快速地将训练好的控制器迁移过来进行使用,而无需重复训练。

主权项:1.一种基于多任务强化学习的流固耦合系统控制方法,其特征在于,包括以下步骤:S1:基于元强化学习方法,训练通用的控制器,具体包括:S11:随机初始化模拟器的物理参数,生成多种模拟器;S12:使用S11中的模拟器训练流体的编码器,获取流体速度场的低维表示;S13:初始化强化学习Value网络,Q网络以及策略网络的参数;S14:使用策略网络生成控制器动作,执行模拟步骤采集数据,存入经验池;若为多任务控制场景,根据任务表示和事后经验重播机制产生新的数据轨迹,并存入经验池;S15:利用S14中采集的数据,计算网络的损失函数和任务的奖励函数,更新模拟器编码网络,actor-critic网络;S16:返回S14,直至每一次完整采样获取的奖励函数值不再明显增加;S17:指定一个目标模拟器的参数和控制子任务,采样少量数据使编码器的输出收敛;S18:基于编码器的输出,使用策略网络输出动作,在新的模拟器中执行控制任务;S2:生成指定模拟环境和目标下的动画。

全文数据:

权利要求:

百度查询: 南开大学 一种基于多任务强化学习的流固耦合系统控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。