重庆邮电大学陈子忠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于粒球计算的文本情感抽取方法、系统及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116150378B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310257830.1,技术领域涉及:G06F16/35;该发明授权一种基于粒球计算的文本情感抽取方法、系统及电子设备是由陈子忠;陈涛;夏书银;王国胤设计研发完成,并于2023-03-16向国家知识产权局提交的专利申请。
本一种基于粒球计算的文本情感抽取方法、系统及电子设备在说明书摘要公布了:本发明涉及计算机技术领域,公开了一种基于粒球计算的文本情感抽取方法、系统、及电子设备,包括如下步骤:S1、通过Bert模型提取输入文本的高级语义表征信息,并通过聚类的方式根据所述输入文本的高级语义表征信息对该输入文本进行簇的划分,将所述输入文本划分成若干粒球,并对若干所述粒球进行分类,从而抽取出输入文本的方面词和观点词;S2、根据所述方面词与观点词之间的距离,对每个方面词与观点词组成的词对进行位置嵌入到BLSTM模型中,经过所述BLSTM模型编码完成后,将来自方面词和观点词的隐藏状态连接起来,从而进行情感分类。本发明提出了一种基于粒球的计算方法来进行方面词与观点词的提取,解决了词语重叠的问题。
本发明授权一种基于粒球计算的文本情感抽取方法、系统及电子设备在权利要求书中公布了:1.一种基于粒球计算的文本情感抽取方法,其特征在于,包括如下步骤: S1、通过Bert模型提取输入文本的高级语义表征信息,并通过聚类的方式根据所述输入文本的高级语义表征信息对该输入文本进行簇的划分,将所述输入文本划分成若干粒球,并对若干所述粒球进行分类,从而抽取出输入文本的方面词和观点词; 在粒球的生成过程中,整个句子则为一个粒球,在进行划分时,比较每个粒球的纯度与预设好的纯度阈值的大小,若所述粒球的纯度不小于所述纯度阈值,则该粒球停止分裂,否则,继续分裂,直到所有的粒球的纯度均不小于所述纯度阈值; 对若干所述粒球进行分类的具体过程为: A1、通过softmax函数用计算每个粒球中标记为方面标签的方面概率Pi ap,然后用来计算出每个粒球中被标记为观点标签的观点概率Pi op,所述方面概率和观点概率均称为标签概率,具体为: 其中,Wt ap和为方面标签的权重和偏差,Wt op、分别为观点标签的权重和偏差; A2、根据粒球的标签概率判定该粒球为方面词或者观点词; S2、根据所述方面词与观点词之间的距离,对每个方面词与观点词组成的词对进行位置嵌入到BLSTM模型中,经过所述BLSTM模型编码完成后,将来自方面词和观点词的隐藏状态连接起来,从而进行情感分类; S2的具体步骤为: S2.1、筛选出属于方面词和观点词的粒球; S2.2、将筛选后的属于方面词和观点词的所述粒球进行组合,形成方面-观点词对,并根据所述方面-观点词对在所述输入文本中的位置进行文本格式的设置,同时,根据非观点词和非方面词在所述输入文本中的位置设置与方面词和观点词相异的文本格式,使所述输入文本转化为特定的文本格式; S2.3、将特定的文本格式的输入文本与该输入文本对应的词向量输入至所述BLSTM模型进行预测,得到方面-观点词对的情感标签,然后筛选出符合条件的方面-观点-情感三元组,从而完成情感分类,筛选出符合条件的属性-情感对,从而完成情感分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400000 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。