买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:昆明理工大学
摘要:本发明公开了一种基于热扩散标签传播的半监督集成工业过程软测量建模方法、系统,本发明采用热扩散标签传播的方法挖掘标记样本与非标记样本之间的关系,在不依赖模型预测的基础上为非标记样本提供伪标记;再结合集成学习思想,首先,通过使用不同的相似度指标构造传播矩阵,从而获得多样性的伪标记数据集,然后以性能提升率为置信度评价指标挑选高置信度伪标记数据集,并将其分别加入标记训练样本集以生成多样性的扩充标记训练数据集;然后,基于标记训练数据集构建多样性的高斯过程回归基模型;最后,采用stacking集成实现模型融合。本发明有效融合了热扩散标签传播和集成学习的优势,能显著提升工业过程软测量建模的预测精度。
主权项:1.一种基于热扩散标签传播的半监督集成工业过程软测量建模方法,其特征在于:包括:S1、收集工业过程数据,确定与工业过程数据的预测变量y相关的p个辅助变量x,辅助变量x即输入变量,并构建用于软测量建模的数据库;其中,用于软测量建模的数据库包括有标签数据集L和无标签数据集U,有标签数据集为同时包含预测变量与输入变量的数据集,L={x1,y1,x2,y2,...,xl,yl};而无标签数据集即为仅包含输入变量的数据集,U={x1,x2,...,xu},l表示有标签数据集中样本总数,u表示无标签数据集样本总数;辅助变量依据预测变量金霉素基质浓度进行选择;S2、对有标签数据集L和无标签数据集U进行归一化处理,获得归一化有标签数据集和归一化无标签数据集;并将归一化有标签数据集分为训练数据集Ltrn、测试数据集Ltest和验证数据集Lval;S3、选择GPR模型作为基模型;S4、依据训练数据集Ltrn对归一化无标签数据集采用热扩散标签传播算法,获得归一化无标签数据集的预测变量值,作为伪标签;将伪标签、归一化无标签数据集结合即为伪标签数据集;S5、基于不同的相似度指标构建相应的邻接矩阵,在此基础上建立不同的热扩散标签传播算法,经过扩散获得多样性的伪标签数据集;S6、将得到的多样性伪标签数据集根据性能提升率选择高置信度的伪数据集作为扩充样本;S7、将S6中作为扩充样本的伪标签数据集分别加入训练数据集以扩充训练数据集得到多样性的扩充标记训练数据集,根据得到的扩充标记训练数据集分别训练GPR模型获得Z个半监督软测量模型;S8、收集新的工业过程在线测量数据,并进行归一化处理;S9、将归一化后的测量数据直接输入到S7中获得的Z个半监督软测量模型中得到Z个预测输出,采用集成学习的方法将Z个预测输出进行集成,集成结果反归一化即为最终预测结果;所述相似度指标的不同由选用的距离相似度度量标准决定,其中,选用的距离相似度度量标准包括布雷柯蒂斯相异度、坎贝拉距离、切比雪夫距离、曼哈顿距离、相关系数距离、余弦相似度距离、欧氏距离、平方欧式距离、汉明距离、Dice系数中的多种;所述将得到的多样性伪标签数据集根据性能提升率选择高置信度的伪数据集作为扩充样本,包括:采用训练数据集Ltrn对GPR模型进行训练,得到训练好的GPR模型;采用训练好的GPR模型对测试数据集Ltest进行预测,得到初始的性能值;将S5中的伪标签数据集分别加入训练数据集Ltrn后采用重新训练GPR模型,再对测试数据集Ltest进行预测,得到新的性能值;将新的性能值与初始的性能值进行对比:如果性能提升率≥α,则保留作为扩充样本;否则,舍弃;其中,α0。
全文数据:
权利要求:
百度查询: 昆明理工大学 基于热扩散标签传播的半监督集成工业过程软测量建模方法、系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。