首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种强化学习驱动的材料逆向设计优化方法、设备、介质及产品 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海大学

摘要:本发明公开一种强化学习驱动的材料逆向设计优化方法、设备、介质及产品,涉及材料设计领域,方法包括:获取n条材料数据;对n条所述材料数据进行差异运算,构建n2条经验池数据,加入经验池;利用经验池对Critic网络和Actor网络采用时间差分学习法进行训练,获得训练好的Critic网络和训练好的Actor网络;利用训练好的Actor网络和训练好的Critic网络进行材料的逆向设计。本发明采用差异运算的方式以获得更多的经验池数据,解决在机器学习在材料逆向设计的应用中存在的样本少的问题,利用时间差分学习法,克服生成对抗网络在训练过程中存在的稳定性差和模式崩溃的问题,可生成更加多样且有效的化合物。

主权项:1.一种强化学习驱动的材料逆向设计优化方法,其特征在于,所述方法包括:获取n条材料数据,每条材料数据包括化学成分和对应的性能参数;对n条所述材料数据进行差异运算,构建n2条经验池数据,加入经验池;所述经验池数据包括第一状态、第二状态、动作、奖励和Done标识,所述第一状态和所述第二状态为n条所述材料数据中的两条不同材料数据,所述动作为第二状态与第一状态之间的差异,所述奖励采用奖励函数计算获得,所述Done标识用于表征所述第二状态的性能是否满足预设性能要求;利用所述经验池对Critic网络和Actor网络采用时间差分学习法进行训练,获得训练好的Critic网络和训练好的Actor网络;在训练过程中Critic网络生成的动作,均与生成所述动作的第一状态结合,构建新的经验池数据,并放回至经验池中,新的经验池数据中的第二状态的性能基于性能预测模型预测获得,所述性能预测模型采用n条所述材料数据训练获得;利用训练好的Actor网络和训练好的Critic网络进行材料的逆向设计。

全文数据:

权利要求:

百度查询: 上海大学 一种强化学习驱动的材料逆向设计优化方法、设备、介质及产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。