买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江工商大学
摘要:本发明属于文本情感分析中的句子级情感分析领域,公开了一种基于文本胶囊神经网络的句子级情感分析方法,包括步骤1:使用字词级别与句子级别的编码器获取句子的特征表示;步骤2:使用数据增强的方式获取同一句子的大量特征表示,为每个句子分别生成多个向量表示;步骤3:将每个句子的多个特征表示拼接,得到一个二维矩阵;步骤4:提出改进的文本胶囊神经网络模型来建模步骤3矩阵中句子局部特征与整体情感极性之间的内在联系;步骤5;矩阵中的每个句子经由文本胶囊网络进行分类,最终预测该句子所对应的情感极性。本发明提高了文本情感分析中的句子级情感分析任务的准确率和解释性。
主权项:1.一种基于文本胶囊神经网络的句子级情感分析方法,其特征在于,包括如下步骤:步骤1:使用字词级别与句子级别的编码器获取句子的特征表示;步骤2:使用数据增强的方式获取同一句子的大量特征表示,为每个句子分别生成多个向量表示;步骤2.1:使用多次dropout神经元随机失活作为文本数据增强的方式,为每个句子获取n个特征表示ei=Dropoute步骤2.2:将e′=[e1,e2,...,en]作为文本胶囊神经网络的原始输入向量;步骤3:将每个句子的多个特征表示拼接,得到一个二维矩阵;步骤4:提出改进的文本胶囊神经网络模型来建模步骤3矩阵中句子局部特征与整体情感极性之间的内在联系;所述步骤4的文本胶囊网络模块具有两层结构:1.初始胶囊层:该层将句子特征聚合为一组与语义相关的句子级语义胶囊;2.分类胶囊层:该层包含多个分别对应某一情感极性的目标胶囊,判断句子是否具有真正的情感极性;所述步骤4矩阵中的每个句子经由文本胶囊网络进行分类,预测该句子是否具有相应的情感极性,具体为:步骤4.1:对单个句子的特征表示e′,创建与e′行维度数目一致的胶囊,初始胶囊层使用多个胶囊更加细化了特征的提取过程,使得提取出来的特征更有利于句子的分类,通过n个取值不同的胶囊,通过权重矩阵得到预测向量: 其中,wij表示连接初始胶囊层和分类胶囊层的权重矩阵,索引i=1,2,...,n代表第几个初始胶囊,索引j=1,2,...,k代表第几个分类胶囊,从而得到多组初始胶囊的输出步骤4.2:对步骤4.1初始胶囊层生成的所有预测向量与动态路由所得权重cij加权求和,得到目标胶囊j的向量表示sj,将挤压函数应用于sj以获得目标胶囊的最终表示vj,即该句子被归纳为代表具有某一情感极性的胶囊中: 其中,vj的数目与句子级情感分析任务中情感极性的数目一致,最后,对所有最终的特征表示[v1,...,vk]进行列维度的拼接,并通过全连接神经网络得到输预测结果: 所述步骤4.2中为预测得到的句子e情感极性,引入损失函数Loss: 其中,和分别是句子e的真实标签和预测标签,均表示为one-hot向量,预测得出句子e是否具备某一情感极性;步骤5;矩阵中的每个句子经由文本胶囊网络进行分类,最终预测该句子所对应的情感极性。
全文数据:
权利要求:
百度查询: 浙江工商大学 一种基于文本胶囊神经网络的句子级情感分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。