恭喜华南理工大学蔡毅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华南理工大学申请的专利一种跨领域细粒度情感分析方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115221272B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210660427.9,技术领域涉及:G06F16/334;该发明授权一种跨领域细粒度情感分析方法、装置及存储介质是由蔡毅;曾雨诗设计研发完成,并于2022-06-13向国家知识产权局提交的专利申请。
本一种跨领域细粒度情感分析方法、装置及存储介质在说明书摘要公布了:本发明公开了一种跨领域细粒度情感分析方法、装置及存储介质,其中方法包括:构建目标领域的细粒度情感分析模型;将无标注样本输入BERT编码器预训练语言模型获得每个单词的语法知识向量表示;基于图卷积网络,通过卷积相邻节点的特征来捕获常识关系结构特征并映射到与BERT编码器相同的单词层级维度向量空间中从而获得常识知识向量表示;拼接语法知识向量表示和常识知识向量表示作为单词的最终特征表示;优化模型的参数。本发明通过结合语法知识和常识关系知识来缩小同一分布空间内的不同领域的领域差异,对资源较少的目标领域具有较强的适应性,提高目标领域的方面抽取以及情感分析的预测效果。本发明可广泛应用于自然语言处理技术领域。
本发明授权一种跨领域细粒度情感分析方法、装置及存储介质在权利要求书中公布了:1.一种跨领域细粒度情感分析方法,其特征在于,包括以下步骤:构建目标领域的细粒度情感分析模型,所述细粒度情感分析模型包括预训练语法知识特征向量表示模块、预训练常识知识关系向量表示模块以及分类器;所述预训练语法知识特征向量表示模块包括BERT编码器,所述预训练常识知识关系向量表示模块包括图卷积网络GCN;将源领域和目标领域的无标注文本输入到所述BERT编码器,获得文本中的每一个单词的语法知识特征向量表示;将源领域或者目标领域的文本输入到所述预训练常识知识关系向量表示模块;其中各领域的每个句子的指定词性的单词输入到ConceptNet常识知识库,并获取每个指定词性的单词到领域概念的路径和关系,从而构建出领域常识图谱;将领域常识图谱输入到图卷积网络GCN中通过预测结点与结点之间的关系,从而获得单词的预训练常识知识特征向量表示;以句子为单位,通过领域常识图谱获得句子中指定词性与领域概念间的路径和关系,构建的子图谱,将子图谱输入到图卷积网络GCN,获得子图谱的向量表示,并通过特征空间转换层映射到和BERT编码器相同的同一分布空间,获得单词的常识知识特征向量表示;将语法知识特征向量表示和单词与单词的常识知识特征向量表示拼接作为单词特征表示;以句子中的各个单词为单位,将单词特征表示输入训练分类器,对分类器进行训练,获得最佳的模型参数;将目标领域无标记数据输入训练后的所述细粒度情感分析模型,对最后拼接而成的单词特征表示向量做分类任务输出预测标签,完成目标领域中的方面词以及方面词的情感极性的识别;还包括预训练BERT编码器的步骤:利用Spacy库中的Pos-tag和dependencyrelation改变BERT编码器的两个子监督任务,从而提升BERT编码器对语法常识的敏感度;提取的语法知识特征向量表示为:hi=transformerei 其中,ei是对应索引单词的连续性词嵌入向量,hi代表将ei通过多层transfermer映射到对应的预训练的词嵌入向量,分别对应的是BERT编码器的两个自监督任务;Wp和bp是权重矩阵;和分别是对应索引单词在依赖树中头标记和子标记的表示,预测索引单词间的依赖关系;[;]、[-]和⊙分别代表拼接、减法和乘法操作;Wd是关系分类的权重矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。