一种用于多领域的文本情感分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：无锡学院

摘要：本发明公开了一种用于多领域的文本情感分类方法，包括：获取目标领域带标签的文本数据并进行预处理，对词嵌入层进行训练，在ALBERT模型中嵌入用于文本主题信息提取的LDA模型，在LDA模型中融合K‑means聚类算法；将词向量序列输入至LDA模型中进行无监督训练，提取文本主题信息，得到“文档‑主题”分布的主题特征向量；将主题特征向量输入到K‑means聚类算法进行二次聚类后，使用余弦相似度输出最优的主题特征向量；通过吉布斯采样方法迭代抽样，LDA模型收敛后得到“主题‑词”分布和“评论‑主题”分布；对文本情感分类模型训练，将通过训练后的文本情感分类模型计算情感分类标签的情感概率，将情感概率最大的标签作为目标数据标签，从而实现跨领域的文本情感分类。

主权项：1.一种用于多领域的文本情感分类方法，其特征在于，包括以下步骤：S1：获取目标领域带标签的文本数据并进行预处理，对将预处理后的文本数据输入到文本情感分类模型预设的词嵌入层，利用词嵌入、段嵌入和位置嵌入将文本数据进行向量化处理，得到词向量序列，所述词向量序列为词向量、段向量、位置向量；所述文本情感分类模型由依次连接的词嵌入层、ALBERT模型、多任务层和分类器组成；S2：对词嵌入层进行训练，在ALBERT模型中嵌入用于文本主题信息提取的LDA模型，在LDA模型中融合K-means聚类算法；S3：将词向量序列输入至LDA模型中进行无监督训练，提取文本主题信息，得到“文档-主题”分布的主题特征向量；S4：将主题特征向量输入到K-means聚类算法进行二次聚类后，使用余弦相似度输出最优的主题特征向量；通过吉布斯采样方法迭代抽样，LDA模型收敛后得到“主题-词”分布和“评论-主题”分布；S5：对文本情感分类模型训练，将通过训练后的文本情感分类模型计算情感分类标签的情感概率，将情感概率最大的标签作为目标数据标签，从而实现跨领域的文本情感分类；其中，步骤S4具体为：将词向量序列输入至LDA模型中进行无监督训练，利用潜在迪利克雷分布提取样本向量的共同特征，得到中间变量，将LDA模型产生的中间变量输入到K-means聚类算法，给每组词向量分配一个可表示整组向量特征的主题特征向量；将主题特征向量与词嵌入层输出的词向量、段向量和位置向量融合，得到融合向量，将融合向量输入到ALBERT模型，输出余弦相似度，余弦相似度通过计算两个向量的夹角余弦值来评估相似度；余弦相似度将融合向量根据坐标值，绘制到向量二维空间；文本数据用表示，是评论的数量，是评论向量，符合“评论-主题”分布；每条评论分配给词的隐含主题份额为，每条评论含有个句子、个词语，每一个词都有一个潜在主题；是评论文本的词向量形式；是“主题-词”分布，K是主题的数量；和分别代表“评论-主题”和“主题-词”服从先验Dirichlet分布的超参数；“评论-主题”分布公式P为：。

全文数据：

权利要求：

百度查询：无锡学院一种用于多领域的文本情感分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种充油海缆的防扩裂导油装置

下一篇：一种多级循环递进式抽奖系统

相关技术

一种充油海缆的防扩裂导油装置

一种多级循环递进式抽奖系统

连接器和电子设备

一种用于汽车变速箱悬架的压铸模具

一种电视墙管理方法、系统、电子装置和存储介质

一种面向单层隔振系统的惯容器设计方法

基于大数据的深度神经网络构建音频数据搜索方法及系统

用于烯烃生产的配置

一种电子水泵噪声振动测试台架装置及噪声测试方法

一种投影区域的确定方法、装置、设备及存储介质

用于使用子图片对特征进行视频编码的系统和方法

一种进气管的清洗方法及半导体工艺设备

情感相关技术

基于情感分析的短视频获赞数量预测方法_北京工业大学_202210317169.4

情感可控脸部动画生成方法、装置、设备及介质_北京交通大学_202410817860.8

基于图卷积网络的文本情感分析方法、系统和电子装置_北京大学深圳研究生院_202010856600.3

一种用于多领域的文本情感分类方法_无锡学院_202310815104.7

基于眼球信息的建筑要素的情感确定方法及相关设备_河北工程大学_202410752174.7

基于建筑要素的情感确定模型的训练方法及相关设备_河北工程大学_202410752176.6

一种基于双分支图卷积网络的细粒度情感分析方法_上海师范大学_202410087956.3

一种基于跨模态自动对齐和预训练语言模型的情感分析方法、系统及设备_哈尔滨工业大学_202111012714.0

一种基于双模态信息增强多头注意力的视频情感分析方法_上海大学_202110195691.5

一种基于文本情感与图像内容感知的跨模态正负向语义分类方法_齐鲁工业大学(山东省科学院)_202411186331.9

分类相关技术

生活垃圾分类设备_广东弓叶科技有限公司_202110272394.6

一种分类装置_上海果研社健康科技有限公司_202323668166.4

分类模型的训练方法、分类方法、装置、设备和存储介质_北京沃东天骏信息技术有限公司_202410741973.4

数据分类方法、数据分类装置、介质及电子设备_北京沃东天骏信息技术有限公司_202110468156.2

一种图书分类分拣执行机构以及图书分类分拣系统_河南工业大学_202420150792.X

图像分类网络中基于信息瓶颈算法的图像分类方法_西安电子科技大学_202210689203.0

主动学习以改善晶片缺陷分类_ASML荷兰有限公司_202380021046.9

点云分类方法及装置_中国科学院自动化研究所_202211494418.3

一种方便分类托盘_简阳市人民医院_202322823151.4

一种产品分类存放装置_胡洋_202323583523.7

文本相关技术

文本纠错方法和装置_北京京东尚科信息技术有限公司_201810030108.3

基于非文本场景的文本聚类方法、装置、设备及存储介质_深圳前海微众银行股份有限公司_202110195010.5

文本检测模型训练方法及装置、文本检测方法及装置_北京金山数字娱乐科技有限公司_202110109985.1

高效的混合文本规范化_腾讯美国有限责任公司_202380021928.5

文本处理模型的训练方法、装置及文本处理方法、装置_北京小米移动软件有限公司_202310316648.9

一种基于文本重复度的文本处理方法、设备及存储介质_北京睿企信息科技有限公司_202410997378.7

文本处理方法、装置、设备及存储介质_科大讯飞股份有限公司_202310493104.X

一种文本处理方法及装置_北京嘀嘀无限科技发展有限公司_201910269029.2

对话文本处理方法及相关装置_深圳市欢太科技有限公司_202310319816.X

一种用于文本识别的表单输送装置_河南环宇博创科技有限公司_202322703326.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于多领域的文本情感分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务