买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东师范大学
申请日:2024-06-28
公开(公告)日:2024-09-10
公开(公告)号:CN118394944B
专利技术分类:..聚类;分类[2019.01]
专利摘要:本发明涉及自然语言处理技术领域,提出了一种基于深度学习的主题建模与情感分析方法及系统,包括如下步骤:获取待分析的无标签文本数据集,进行预处理;针对预处理后的数据基于深度学习的特征融合方式进行文本嵌入,动态确定降维维度对嵌入文本降维,对降维后的数据进行聚类得到主题;筛选出与主题相邻分布的噪声数据,计算主题数据和相邻噪声的一致性,针对每个主题重划分噪声数据进行主题优化;将划分主题后的待分析数据,分析主题的情感总体倾向,得到情感分析结果。本发明将建模主题与情感分析实现了深层次多维度的分析,解决了降维和长文本的问题,提高了情感分类的细粒度,能够提高文本数据情感分类的准确性。
专利权项:1.基于深度学习的主题建模与情感分析方法,其特征在于,包括如下步骤:获取待分析的无标签文本数据集,进行预处理;针对预处理后的数据基于深度学习的特征融合方式进行文本嵌入,动态确定降维维度对嵌入文本降维,对降维后的数据进行聚类得到主题;筛选出与主题相邻分布的噪声数据,计算主题数据和相邻噪声的一致性,针对每个主题重划分噪声数据进行主题优化;将划分主题后的待分析数据,依次进行变量定义、基于知识图谱嵌入进行段落分割、变量标注和设计时序分析提取主题的时间变化和主题发展特征的连续性,分析主题的情感总体倾向,得到情感分析结果,具体步骤包括:按照统计学方法将数据定义为自变量和因变量;在SeqModel段落分割模型中引入知识图谱嵌入,融合外部知识改进文本表示并对主题化的数据进行段落分割;对于段落分割处理后的数据,标注一部分变量数据,采用预训练的BERT模型对主题中的变量进行预测并标注无监督数据;对标注后的新数据集,对每个主题中自变量和因变量,分别进行主题时序分析和主题情感倾向分析,计算自变量和因变量之间的关联性,得到情感分析结果。
百度查询: 山东师范大学 基于深度学习的主题建模与情感分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。