一种多粒度外卖用户评论情感分析方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京工业大学

摘要：本发明公开了一种多粒度外卖用户评论情感分析方法。所述情感分析的方法，包括1对评论数据进行预处理，包括繁简转换、数据去重、表情数据切分等；2对评论数据采用端到端的训练网络进行训练，并以此网络为基线网络，该网络训练的结果为基线模型；3在训练网络中加入注意力机制，提升网络对数据特征的提取能力；4对数据采用多种模型进行训练，并将多个模型进行融合，各自取长补短。通过上述操作最终实现对外卖评论数据的情感分析。本发明设计的相关方法面向真实用户数据，考虑了数据中存在的多种问题，并能够在短时间内取得较好的训练及分类效果。

主权项：1.一种多粒度外卖用户评论情感分析方法，其特征在于：该方法包括如下步骤：1对原始外卖平台真实评论数据进行预处理，达到能够对神经网络进行训练和测试的目的；将所述原始外卖平台真实评论数据进行汉语语言繁简转换，即在外卖平台中存在使用中文繁体进行评价的用户；2对所述原始外卖平台真实评论数据进行分词处理，使用jieba和char结合的分词工具对评论数据进行分词处理；首先将所述原始外卖平台真实评论数据利用jieba分词工具进行第一轮分词处理，然后抽取10％分词后的结果进行评价；遇到分词不准确的评论数据进行标记，并从jieba分词工具的分词结果中剔除，最终形成第一阶段分词结果集合M1；针对jieba分词工具分词不准确的评论数据，利用char分词工具进行重新分词，分词后的结果形成第二阶段分词结果集合M2；随后将两阶段分词结果集合M1与M2合并形成最终的分词结果M终；3在数据预处理及分词阶段结束后，利用基于LSTM的文本分类模型构建基础模型；4在模型初步构建完成后，利用自注意力机制对所述的基础模型进行优化；在自注意力机制中，多头注意力机制使模型能够从不同子空间关注到相应的信息；5在模型构建和优化完毕后，开始对所涉及到的外卖点评数据进行训练；对训练过程中loss的处理，选择不对训练loss进行调整；对训练数据的采样，选择不对训练数据进行过采样或者欠采样处理；在训练阶段，只针对训练结果按照类别在训练数据的分布进行调整；6在对模型进行训练的过程中，对UnknownWords进行选择；根据所述方法，其中步骤6包括：通过计算词汇表中的每个单词在当前条件下出现的概率，来生成该条件下的单词；从第二轮开始以0～0.02的随机概率设置原词为UNK；7在UnknownWords选择完毕后，采用端到端的模型对数据再次进行训练，该模型训练的结果将作为基线结果；采用端到端模型对数据进行训练，在训练过程中，对模型参数进行调整，直至取得训练结果；8在端到端的模型对数据再次进行训练后，使用BERT-MRC模型对数据进行训练；模型输入：在使用BERT-MRC模型前，进行数据预处理操作；模型结构：在使用BERT编码得到词向量之后，训练三个分类器，分别用于预测开始标签、结束位置标签以及一个概率矩阵；开始、结束位置序列是和输入文本等长的一个序列，对应每个字符是否是实体片段的开始和结束位置，概率矩阵代表文本中每个片段是否是实体片段的概率；上述预测开始标签、结束位置标签两个标签序列和一个矩阵三个分类器在训练过程中共求三个loss，模型的总loss是矩阵三个分类器的三个loss之和；9在端到端的模型对数据再次进行训练后，使用fastText模型对数据进行训练；根据所述方法，其中步骤9包括：使用字符级别的n-gram向量表示句子，fastText使用字符级别的n-grams来表示一个单词；10在使用fastText模型对数据进行训练后，对模型进行优化，并对多种模型进行集成处理；模型优化：在基线模型的基础上，效仿阅读理解，增加了SelfAttention层，并将Attention之后的输出和原始LSTM输出，采用Gate或者SemanticFusion的方式进行融合，从而提升模型训练效果；模型集成：采用多种粒度的分词方式，引入基于SentencePiece的多种粒度分词；在模型选择的时候选取了基线模型训练中最优的轮次模型，集成的时候采用了按多方面效果分开加权集成的方式。

全文数据：

权利要求：

百度查询：北京工业大学一种多粒度外卖用户评论情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：投屏声音故障的确定方法、装置、电子设备和存储介质

下一篇：基于海洋渔业价值链的海产品汞金属总量核算方法和装置

相关技术

投屏声音故障的确定方法、装置、电子设备和存储介质

基于海洋渔业价值链的海产品汞金属总量核算方法和装置

一种室内立式蔬菜栽培架

订单处理方法、装置、电子设备及存储介质

云计算架构多租户任务资源分配调度方法及装置

一种煤矿井下风水管路在线监测系统

双酚A型聚碳酸酯降解用催化剂及降解方法

一种无施工平台的远岸成品钢管桩的测量方法

用于处理振动信号的方法、计算设备和存储介质

一种平开窗

植物的耐热性或耐干燥性提高剂、耐盐性提高剂、活性提高剂

一种轮胎X光检验机输送定位系统及工作方法

用户相关技术

用于生成和显示用户的表示的设备、方法和图形用户界面_苹果公司_202411029393.9

用于用户装备内和用户装备间取消交叠通信的技术_高通股份有限公司_202411400579.0

便于用户改造的保险柜_合肥荣事达电子电器集团有限公司_201911095809.6

用于相机共享的用户界面_苹果公司_202380032372.X

通信方法、用户设备和基站_京瓷株式会社_202380032747.2

用于交友的用户生成内容系统_罗布乐思公司_201980057751.8

用于认证车辆用户身份的方法和车载装置_上汽通用汽车有限公司_202410947488.2

用户交互方法、系统、车辆、设备及存储介质_蔚来汽车科技(安徽)有限公司_202411024043.3

一种目标用户确定方法及计算设备_车智互联(北京)科技有限公司_202410939920.3

用户侧的图像融合方法、装置和存储介质_江苏三艾云计算科技有限公司_202410922399.2

评论相关技术

评论信息展示方法、装置、服务器、终端_北京达佳互联信息技术有限公司_202011495176.0

评论内容的处理方法、装置、可读存储介质及程序产品_咪咕文化科技有限公司_202410993007.1

评论信息的显示方法、装置、电子设备及存储介质_北京达佳互联信息技术有限公司_202411046356.9

多个社交媒体平台的评论私信数据处理方法及装置_一网互通(北京)科技有限公司_202411109703.8

用户评论信息推送方法、计算机设备与可读存储介质_时趣互动(北京)科技有限公司_202410763355.X

社交媒体中的评论智能管理方法及装置、存储介质、计算机设备_成都安易迅科技有限公司_202410791146.6

一种多粒度外卖用户评论情感分析方法_北京工业大学_202110303408.6

基于文本评论挖掘和群体决策的智能内容推荐方法及设备_中国人民解放军国防科技大学_202410894607.2

基于大类排名与评论率的电商平台商品销量估算方法_小数汇智(宁波)科技有限公司_202311533626.4

一种基于价值体系驱动的主观评论价值编辑方法_中国科学技术大学_202411161518.3

情感相关技术

一种多模态情感分析方法及装置_广东工业大学_202411005001.5

一种基于混合机制的多模态情感分析方法及系统_哈尔滨工程大学_202410997016.8

情感数据扩充方法、装置、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410446716.8

一种基于深度学习的人工智能情感识别系统_干将未来科技产业(北京)有限公司_202411116194.1

一种基于忆阻神经网络的情感联想记忆仿生电路_武汉工程大学_202411442897.3

以音频模态为目标模态的多模态情感分析方法和系统_烟台大学_202411464881.2

一种基于BERT对抗训练的比较句情感分析方法及系统_西安交通大学_202210421996.8

基于不确定性估计的多模态情感分析方法、装置及设备_南京邮电大学_202210560653.X

基于生理信号及面部表情的多模态情感评价方法及装置_威莱(广州)日用品有限公司_202411420032.7

基于特征选择的多情感音乐数据分类方法、装置及可读介质_华侨大学_202411228297.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种多粒度外卖用户评论情感分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务