基于自然语言处理和随机森林的特钢生产锭型预测方法

导航：龙图腾网> 最新专利技术> 基于自然语言处理和随机森林的特钢生产锭型预测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：冶金自动化研究设计院

摘要：一种基于自然语言处理和随机森林的特钢生产锭型预测方法,属于特钢生产一体化排产与报料技术领域。通过分析钢铁企业客户订单，提取有关锭型预测的关键特征，以锭型为预测目标变量，构建含有多个客户订单的大数据集。采用自然语言处理方法，将每个样本订单中特征属性中的文字或特殊符号转化为数字属性，并采用随机森林预测模型进行锭型预测，从而实现根据订单中的钢种、尺寸和工艺要求等信息，匹配出客户订单相对应的锭型类别与型号。优点在于，解决了因订单数据集样本特征中存在文本和数值混合问题而引发的锭型分类预测难题。

主权项：1.一种基于自然语言处理和随机森林的特钢生产锭型预测方法，其特征在于，具体步骤如下：步骤1：数据预处理；采集3000～5000条数量的客户订单，提取与锭型预测相关的特征，根据工艺规则对每个订单配置相应的锭型类别与型号，并将其作为目标变量；对数据进行清洗，删除错值坏值，修改错误格式，补充缺失值；分析样本数据的分布情况，通过手动匹配的模式，尽量使各类别的样本数量趋于均衡，从而构建出具有均衡样本量的大数据集；步骤2：对每个样本的目标变量进行编码，即对每条订单的锭型类别进行编码；因锭型类别有七种，属于多分类问题，故采用标签编码方式，将其数值化，即采用7种不同数值描述7中锭型；步骤3：自然语言处理针对特钢订单中的特征存在离散类别型、连续数值型和中文文本型三种形式的问题，采用自然语言处理方法，即不同的编码方法，将其转化为数字格式：采用N维稀疏向量表示数据集中的离散类别型特征，N表示统计类别总数，第N维维度上数值为1，其余N-1维上数值用0表示；对于连续数值型，“规格”特征，采用0-1标准化编码方式，使数据映射成区间为[0，1]的标准值，设x0代表原规格数值，x1代表标准化的规格，xmax代表规格中的最大值，xmin代表规格中的最小值，则对于订单里的文本类特征，使用词袋模型将其转化成以“词表空间”为维度的稀疏向量，抽取其中的信息；首先根据中文停用词词库去除其中的常见停用词，再去除无意义符号；然后使用前向后向最大匹配算法将被解析的“长文本”分解为若干个“词语”，然后采用TF-IDF方法进行编码；该编码方式的核心思想是通过配置权重表述“词语”的意义性，即对于那些出现频率很高但没有实际意义的词，赋予较小的权重，将其“置为0”，从而减少其对模型训练的影响；设集合T＝{t1,t2,t3···tn}为语料库中所有词语的集合，ti表示每个词语，集合D＝{d1,d2,d3···dk}为所有文章的集合，dj表示每篇文章；TF-IDF方法的模型如下：其中，TFij为词频，IDFi为逆文档频率，nij为词语ti在文档dj中出现的次数，表示文档dj中词语数目之和；|D|为语料库中的文档总数，|Di|为包含关键词ti的文档总数目；最后，TF-IDF的值是这两个值的乘积值，即TFIDFi,j＝TFij×IDFi3其中，TFIDFi,j为TF-IDF的值；将上述数字格式化后的特征组合起来；步骤4：使用交差验证的方式对样本切分训练集和测试集，选择80％为训练集，20％为测试集；步骤5：构建基于随机森林的锭型分类预测模型，并采用步骤4中构建的数据集，进行训练和验证。

全文数据：

权利要求：

百度查询：冶金自动化研究设计院基于自然语言处理和随机森林的特钢生产锭型预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种视频的播放方法、装置及计算机可读存储介质

下一篇：一种基于FIFO处理CAN通信消息的优化系统及方法

相关技术

一种视频的播放方法、装置及计算机可读存储介质

一种基于FIFO处理CAN通信消息的优化系统及方法

一种氧化亚硅负极材料及其制备方法

线条体固定部件、线条体增设用固定部件以及线条体安装方法

一种缺陷检测方法和相关设备

一种高效快照压缩视频字幕生成方法

一种充油海缆的防扩裂导油装置

金属燃料电池与其他类型蓄电池的协同应用系统及方法

一种接地故障线路辨识方法、系统、装置及存储介质

一种像控点坐标生成方法、系统、设备及存储介质

一种进气管的清洗方法及半导体工艺设备

集中供暖设备

森林相关技术

一种基于人工智能的森林火灾预测方法及系统_广生数字科技(河南)有限公司_202410815964.5

一种基于生成对抗网络的森林烟火图像检测方法_江苏科技大学_202410800061.X

基于随机森林的资源消耗趋势预测方法、装置和设备_中国人民解放军国防科技大学_202210742491.1

一种基于林业生态大数据的森林资源分析方法及系统_日照市自然资源和规划局_202410776835.X

一种森林培育用苗木自动滴灌施肥装置_山西省太行山国有林管理局营盘林场_202410746253.7

一种基于随机森林的指控网络关键节点智能识别方法_中国电子科技集团公司第五十四研究所_202410868718.6

一种森林树木根系分泌物长期原位收集方法及其装置_山西农业大学_202410829684.X

联合归一化植被指数的多基线InSAR森林高度反演方法、装置和介质_内蒙古农业大学_202410931297.7

一种基于随机森林的深层碳酸盐岩沉积微相分析方法_中国地质大学(北京)_202211131874.1

一种基于LAB颜色空间特征提取和随机森林的负荷识别方法和装置_国网上海市电力公司_202410359824.1

特钢相关技术

一种智能化特钢圆棒试样粗加工系统及方法_马鞍山钢铁股份有限公司_202410757016.0

一种特钢同炉多批次炉次能耗实绩的归集方法_石家庄钢铁有限责任公司_202410877874.9

一种高端特钢钨基或钴基粉末高速钢的制备方法_西安欧中材料科技股份有限公司_202410431051.3

一种应用于特钢厂二次精炼的真空脱气干式真空机组_江阴天田真空设备制造有限公司_202011015441.0

一种带有复合内涂层特钢浇注装置_淄博恒森耐火材料有限公司_202410187006.8

特钢棒材智能化余热在线热处理方法_中冶华天工程技术有限公司_202210607829.2

基于Legendre多小波变换的特钢材表面缺陷检测与定位方法_重庆理工大学_202410325874.8

一种优特钢棒材切割装置_中天钢铁集团有限公司_202323211736.7

紧凑式棒材生产线及优特钢棒材生产方法_中冶赛迪工程技术股份有限公司_202410414245.2

应用于特钢厂高速工具钢炼钢流程的仿真优化调度模型_冶金自动化研究设计院_202011357330.8

生产相关技术

食品相关颗粒、生产方法及生产装置_努利希尔有限公司_202280073611.1

无机营养源的生产方法及其生产系统_稳碳永续股份有限公司_202310277316.4

电芯生产设备及电芯生产方法_珠海冠宇电池股份有限公司_202411024931.5

封装天线生产测试_英飞凌科技股份有限公司_202010761560.4

混凝土减水剂生产装置_河南省新星新材料科技有限公司_202322027320.3

组装生产系统_本田技研工业株式会社_202310285447.7

生产处理装置_株式会社石田_202111068691.5

用于烯烃生产的配置_鲁姆斯科技有限责任公司_202410821427.1

月饼生产接料台_珠海市浩麦食品有限责任公司_202420109948.X

石英板生产工艺_泉州艺峰股份有限公司_202410870647.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于自然语言处理和随机森林的特钢生产锭型预测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务