Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安交通大学

摘要:本发明公开了一种双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统,所述方法包括以下步骤:S1,将预获取的纳米压痕测量曲线输入训练好的预测值获取网络,获得所述纳米压痕测量曲线的参数预测值;S2,将所述参数预测值作为深度强化学习算法的迭代初值进行迭代,获得预获取的纳米压痕测量曲线的全局参数解的逼近;所述全局参数解的逼近达到预设收敛条件时,将所述全局参数解的逼近作为KVFD模型的力学参数进行输出。本发明的方法,在迭代中引入了参数预测值进行参数指导,能够较好地逼近全局最优解。

主权项:1.一种双loss价值网络深度强化学习KVFD模型力学参数全局优化方法,其特征在于,包括以下步骤:S1,将预获取的纳米压痕测量曲线输入训练好的预测值获取网络,获得所述纳米压痕测量曲线的参数预测值;其中,训练好的预测值获取网络是基于LSTM隐层的循环神经网络,所述循环神经网络在训练时使用的LOSS函数值由输入网络的曲线与曲线对应参数和网络输出的参数与参数对应曲线共同计算;S2,将所述参数预测值作为深度强化学习算法的迭代初值进行迭代,获得预获取的纳米压痕测量曲线的全局参数解的逼近;其中,所述深度强化学习算法的奖励值预测网络通过当前迭代参数对应曲线与真实曲线的差值,给出当前参数向不同方向变化时的奖励值,指导参数向全局参数逼近;所述全局参数解的逼近达到预设收敛条件时,将所述全局参数解的逼近作为KVFD模型的力学参数进行输出;其中,步骤S1中,所述预获取的纳米压痕测量曲线包括时间序列、受力序列和压痕深度序列;步骤S2中,所述将步骤S1获得的参数预测值作为深度强化学习算法的迭代初值进行迭代,获得预获取的纳米压痕测量曲线的全局参数解的逼近的过程中,每一次迭代的具体步骤包括:1使用奖励评价规则和所述奖励值预测网络分别对当前迭代参数的备选参数集进行奖励值预测,将二者加权相加后作为对当前迭代参数的备选参数集的奖励评价;所述奖励评价规则为,对于某个备选参数的评价,先计算备选参数对应曲线与预获取的纳米压痕测量曲线的曲线差值Δ,之后计算曲线差值的绝对平均值奖励值r的评价公式表示为: 2根据步骤1获得的奖励评价与深度强化学习算法中的Q表当前行的内容,计算Q表的新一行,找到Q表新一行中最大值,将其对应的备选参数作为当次迭代结果参数。

全文数据:

权利要求:

百度查询: 西安交通大学 双loss价值网络深度强化学习KVFD模型力学参数全局优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。