买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:淮阴工学院
摘要:本发明公开了一种化工产品评论情感分析方法,基于从网站采集的化工产品评论反馈文本若干,对其进行数据处理和清洗后进行标签分类;将数据集转化成ALBERT模型能够接受的向量形式;利用albert_zh对处理过的向量形式数据进行训练;将向量形式数据输入多头注意力机制,在每层TransformerBlock模块中加入多层次图注意力层Multi‑GAT,基于每个向量节点进行注意力系数计算并进行softmax处理;将每层图注意力层计算出的结果采用多层次加权聚合的方式获取并形成最终表示;对ALBERT+Multi‑GAT模型的输出进行情感极性分析。本发明为解决化工产品评论长文本中情感分析不准确的问题,相比较主流的情感分析模型,在准确率、召回率及F1得分方面都有着明显的提升。
主权项:1.一种化工产品评论情感分析方法,其特征在于,所述方法包括如下步骤:S1:从网络采集若干化工产品评论反馈文本,并对文本进行数据处理和清洗;S2:按照文本标题和内容制表保存,对每一段内容根据方面级评判标准进行手动标签和注释,处理好的数据集按照8:1:1的比例随机拆分为训练集、验证集和测试集;S3:将数据集转化成ALBERT模型所接受的向量形式,将输入文本序列的不同部分进行区分,输入序列开头加入标记标记[CLS]classification用于分类任务;每句末尾加入特殊的标记[SEP]separator分隔不同文本句式,向量形式,取得词语、片段、位置三个向量之和,作为预训练输入;S4:将处理后的向量序列投入ALBERT模型训练;S4.1:获取的向量序列中输入包括多头注意力机制multi-headattention的ALBERT模型单元,输入序列被转化为查询、键和值三个向量,用于计算每个位置的注意力权重并将不同的attention结果拼接;S4.2:在每层模型单元中加入Multi-GAT多层次图注意力层,通过多层次图注意力机制将不同层次的注意力机制关注到的不同粒度的信息整合;S4.3:定义并初始化多层次GAT卷积层,基于每个序列的向量节点的GAT模型在计算注意力系数时进行多层次加权聚合,即每一层负责对输入的节点进行加权聚合;S4.4:对每层的输出进行池化和聚合,将不同层次的信息进行汇总,形成最终的表示;S5:添加一个输出层,使用Sigmoid函数作为激活函数对ALBERT+Multi-GAT模型的输出进行情感极性分析,得到每个标签的预测概率。
全文数据:
权利要求:
百度查询: 淮阴工学院 一种化工产品评论情感分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。