一种基于舆情大数据的文本情感分析方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山西首讯信息技术有限公司

摘要：本发明属于自然语言处理技术领域，具体涉及一种基于舆情大数据的文本情感分析方法，包括：获取舆情文本数据，分组后将文本数据根据情感正负倾向排序；使用预训练模型对文本向量化，得到词向量和句向量特征；对文本进行分词，对分词结果中的词进行逐个删除，计算删除词后的特征向量和原始文本向量的相似度；根据计算出的文本相似度表示词汇重要性，使用词向量加权求和方法表示文本特征；根据情感相对排序关系构造损失函数，根据损失函数调整模型参数，当损失函数最小时完成模型训练；本发明提出一种计算词汇重要性的方法，利用该权重加权词向量计算文本向量特征，增加了模型评判文本情感分数的能力。

主权项：1.一种基于舆情大数据的文本情感分析方法，其特征在于，包括：获取文本数据，将文本数据输入到训练后的基于舆情分析的文本情感分析模型中，得到文本情感分析结果；对基于舆情分析的文本情感分析模型进行训练包括：S1、获取舆情文本数据，将舆情文本数据划分为一个组；一个组中的数据包括k个文本，k为大于3小于M的任意整数，其中M的计算公式为：其中，mall表示机器显存大小，mmodel表示模型占用显存大小，lenth为平均句长，mx为一个token占用显存大小；S2、对组内的数据进行情感倾向排序，并将排序后的数据作为训练数据集；S3、对训练数据集中的文本进行分词处理，根据分词结果对句子中的词分别进行删除，得到与词数量相等的句子；S4、采用预训练模型对删除词后的句子进行向量化处理，得到各个句子的文本向量；S5、计算各个文本向量与原始文本向量的相似度；其计算公式为：其中，a和b分别表示a向量和b向量，ai表示a向量中第i个纬度的值，bi表示b向量中第i个纬度的值，d为向量纬度；S6、根据相似度计算词汇重要性权重，将词汇重要性权重输入到评分模型中，得到对词向量的情感关系评分，并根据评分结果对词进行情感关系排序；具体包括：采用文本相似度表示词汇重要性，使用词向量加权求和方法表示文本向量特征；其中文本向量特征计算公式为：Seq_emb＝∑μ*tanhword_emb 其中，word_emb为输入预训练模型后的字向量，tanh为激活函数，μ为权重，simei,et表示计算ei,et文本相似度，ei表示删除第i个词，∑simej,et表示逐个删除词后计算得到的相似度求和；S7、根据情感关系排序结果构建模型的损失函数；S8、不断调整模型参数，当损失函数收敛时，完成模型的训练。

全文数据：

权利要求：

百度查询：山西首讯信息技术有限公司一种基于舆情大数据的文本情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种养生保健酒

下一篇：像素补偿方法、装置、设备、显示面板及存储介质

相关技术

一种养生保健酒

像素补偿方法、装置、设备、显示面板及存储介质

人体属性的识别方法、装置、电子设备及存储介质

一种1.0-2.0mm厚度热基镀锌原料的生产方法

基于数字收银机按键的力反馈控制方法及系统

一种消化内科催吐装置

一种冰孔约束下水下航行体出水试验装置及试验方法

基于场景感知的自动化编队群组引导方法

一种水中抗分散裂缝修复注浆料及其制备方法

图像检测方法、装置、设备、存储介质及程序产品

一种汽车零部件冲压加工用夹具

一种组合式固定件依附锁定器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于舆情大数据的文本情感分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务