Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国矿业大学褚菲获国家专利权

中国矿业大学褚菲获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国矿业大学申请的专利一种面向非线性间歇过程下的深度强化学习优化补偿方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119200538B

龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411333691.7,技术领域涉及:G05B19/418;该发明授权一种面向非线性间歇过程下的深度强化学习优化补偿方法是由褚菲;吴振明;李翔;王建文;张恩泽;贾润达;何大阔设计研发完成,并于2024-09-24向国家知识产权局提交的专利申请。

一种面向非线性间歇过程下的深度强化学习优化补偿方法在说明书摘要公布了:一种面向非线性间歇过程下的深度强化学习优化补偿方法,将三维输入数据矩阵展开成二维矩阵;进行标准化处理;构建JY‑KPLS模型;构造JY‑KPLS模型优化问题;求解优化问题;计算历史与查询数据的相似性;根据相似性大小,从旧、新过程数据集中分别筛选出m条旧数据、n条新数据,并与当前查询数据进行作差;以偏差样本作为数据集,建立JITL‑JYKPLS局部模型,解决失配问题;对补偿后模型与优化系统进行交互、试错训练;若当前批次内训练总奖励值超过前一批次内训练总奖励值,则将当前训练好的优化系统用于批次间优化;否则,采用前一批次优化系统用于批次间优化;输出最终产品质量。该方法可显著提升最终产品的质量。

本发明授权一种面向非线性间歇过程下的深度强化学习优化补偿方法在权利要求书中公布了:1.一种面向非线性间歇过程下的深度强化学习优化补偿方法,包括间歇生产过程A和间歇生产过程B,所述间歇生产过程A为经过较长时间生产的旧生产过程,具有充分的历史运行数据及运行控制经验,所述间歇生产过程B为即将投产的新生产过程;同时,间歇生产过程A和间歇生产过程B具备相同或相近的生产设备,且间歇生产过程A和间歇生产过程B的最终产品属于一个产品族中,其特征在于,包括以下步骤: 步骤一:将间歇生产过程A、间歇生产过程B的三维输入数据矩阵按照批次方向展开成二维矩阵,分别为Xa、Xb; 步骤二:对Xa、Xb的各列进行零均值和单位方差处理,同时,对输出数据矩阵Ya、Yb进行零均值和单位方差处理; 步骤三:构建JY-KPLS过程模型; S31:令,,,,其中,表示提取潜变量的次序; S32:从联合输出矩阵中选取任意一列作为初始的,其中,; S33:根据公式1计算的得分向量,根据公式2计算的得分向量: 1; 2; S34:根据公式3计算联合输出变量的共同负载矩阵,并归一化负载矩阵,其中,; 3; 式中,; S35:计算的得分向量,计算的得分向量; S36:判断和是否收敛,若收敛,则进入步骤S37,否则返回S33; S37:分别根据公式4、5和6缩减核矩阵与联合输出矩阵,以得到相应的残差矩阵、和; 4; 5; 6; S38:令,重复执行S32至S37直至提取出n个主元; S39:基于已知的核矩阵和求得的得分矩阵与,根据公式7计算出JY-KPLS过程模型的输出; 7; 式中,是间歇生产过程A和生产过程B输出变量的联合矩阵,是间歇生产过程A和生产过程B潜变量的联合矩阵; 步骤四:根据公式8构造JY-KPLS过程模型的优化问题; 8; 步骤五:求解公式8中的优化问题,并得到优化问题的解xcur; 步骤六:将xcur作为查询点xq,利用公式9来计算历史数据与查询数据的相似性; 9; 式中,是权重参数,是和之间的欧式距离,表示和之间的角度,,; 步骤七:根据相似性大小,从旧过程数据集中筛选出m条旧数据,从新过程数据集中筛选出n条新数据; 步骤八:利用筛选出的数据与当前查询数据进行作差,将得到的偏差样本作为构建局部补偿模型的数据集和; 步骤九:利用筛选出的数据建立JITL-JYKPLS局部模型,并采用信赖域优化方法解决JITL-JYKPLS局部模型失配的问题; S91:根据公式10构造JITL-JYKPLS局部模型的优化问题,即基于即时学习和信赖域的优化补偿问题; 10; 式中,D为球形信赖域半径,为信赖域约束; S92:通过求解公式10得到优化补偿值,进而得到补偿后的操作变量轨迹; S93:利用JY-KPLS过程模型预测最终操作变量轨迹对应的综合经济效益增益,若综合经济效益增益满足公式11,则选择作为批次内训练的操作变量轨迹,进而预测出过程输出,获得新的模型训练环境,否则,认定第q次训练不成功,继续使用上一训练的操作变量轨迹作为当前一次训练的最终操作变量轨迹,即; 11; 式中,为综合经济效益,为阈值; S94:计算经济效益的实际增益,以更新信赖域半径D;如果,则令;如果,且,则令;否则,令; 步骤十:根据步骤九获得的补偿后模型与优化系统进行交互、试错训练; 步骤十一:在批次生产结束后,判断当前批次内训练总奖励值是否超过前一批次内训练总奖励值;若超过,则将当前训练好的优化系统用于批次间优化;否则,采用前一批次训练得到的优化系统代替当前优化系统用于批次间优化; 步骤十二:将优化后的参数输入控制器中,利用控制器控制生产系统进行生产作业,输出最终产品质量; 步骤十三:令k=k+1,更新建模数据,返回步骤一进行下一个批次优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国矿业大学,其通讯地址为:221116 江苏省徐州市大学路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。