中山大学王甲海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种基于prompt的文本情感原因分析方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114416991B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210055865.2,技术领域涉及:G06F16/35;该发明授权一种基于prompt的文本情感原因分析方法和系统是由王甲海;郑晓鹏设计研发完成,并于2022-01-18向国家知识产权局提交的专利申请。
本一种基于prompt的文本情感原因分析方法和系统在说明书摘要公布了:本发明公开一种基于prompt的文本情感原因分析方法和系统,方法包括以下步骤:S1:收集文本数据并进行预处理;S2:在预处理后的文本中先后添加文本提示词和文本待预测词,并针对文本待预测词,设置目标候选词集;S3:对文本添加子句分割符号和文本起始符号与结尾符号;S4:使用BERT预训练模型,对文本和目标候选词集进行特征向量编码,得到文本特征向量和目标候选词集向量;S5:计算文本特征向量和目标候选词集向量之间的编码距离,利用softmax函数计算每个待预测词的编码距离向量的概率,得到待预测词的预测结果;S6:基于具体任务进行预测模块组合,得到适用于具体文本情感原因分析任务的方法。本发明引入prompt解决了微调任务和预训练任务之间的差异性。
本发明授权一种基于prompt的文本情感原因分析方法和系统在权利要求书中公布了:1.一种基于prompt的文本情感原因分析方法,其特征在于,包括以下步骤: S1:收集文本数据并进行预处理; S2:在预处理后的文本中先后添加文本提示词和文本待预测词,并针对所述文本待预测词,设置目标候选词集; S3:对步骤S2处理后的文本添加子句分割符号和文本起始符号与结尾符号; S4:使用BERT预训练模型,对步骤S3处理后的文本和步骤S2设置的目标候选词集进行特征向量编码,得到文本特征向量和目标候选词集向量; S5:计算所述文本特征向量和目标候选词集向量之间的编码距离,利用softmax函数计算每个待预测词的编码距离向量的概率,得到待预测词的预测结果; S6:基于具体任务进行预测模块组合,得到适用于具体文本情感原因分析任务的方法; 所述步骤S2中添加文本待预测词,并针对所述文本待预测词,设置目标候选词集,具体分为: 1基于情感识别任务,对情感子句识别设置情感待预测词,得到情感指示模块,所述情感指示模块的文本构建模版和候选词集为: 其中,函数表示情感指示模块的文本构建模版,函数表示情感指示模块中的待预测词的候选词集,ci表示文本中的第i个子句,·表示加入文本中的情感提示词,[MASK]emo表示情感待预测词; 2基于情感原因分析任务要求,对原因子句识别设置原因待预测词,得到原因指示模块,所述原因指示模块的文本构建模版和候选词集为: 其中函数表示原因指示模块的文本构建模版,函数表示原因指示模块中的待预测词的候选词集,ci表示文本中的第i个子句,·表示加入文本中的原因提示词,[MASK]cau表示原因待预测词; 3基于情感原因之间的匹配任务要求,对情感原因子句之间的匹配工作设置匹配待预测词,得到指向约束模块,所述指向约束模块的文本构建模版和候选词集为: 其中函数表示指向约束模块的文本构建模版,函数表示指向约束模块中的待预测词的候选词集,ci表示文本中的第i个子句,·表示加入文本中的匹配提示词,[MASK]dir表示匹配待预测词,n表示当前文本的子句数量,“None”表示没有与当前子句相关联的其他子句; 步骤S2中,为了让预训练模型完成子句序列特征的学习任务,通过在文本中加入序列待预测词,构建了序列学习模块,序列学习模块的文本构建模版和候选词集为: 其中函数表示序列学习模块的文本构建模版,函数表示指序列学习模块中的待预测词的候选词集,d表示输入的文本,ci表示文本中的第i个子句,[MASK]dir表示序列待预测词,n表示当前文本的子句数量; 所述步骤S6具体包括: 1对于情感原因匹配对提取任务,同时组合情感指示模块、原因指示模块、指向约束模块和序列学习模块,完成对情感子句的识别、原因子句的识别以及情感原因子句匹配这三个子任务,完整的构造方式如下方公式所示: 其中情感子句和原因子句的预测可以通过指示模块完成,具体形式如下方公式所示: 其中Pemo函数和Pcau函数分别表示情感子句和原因子句的预测结果,femo函数和fcau函数分别表示情感待预测词和原因待预测词的预测结果; 同时情感子句和原因子句之间的匹配预测可以通过指向约束模块和原因指示模块共同完成,具体形式如下方公式所示: 其中i,j表示第i个子句和第j个子句构成情感原因匹配对关系,null表示没有子句和当前子句构成关联,fdir表示匹配待预测词的预测结果; 2对于情感原因提取任务,同时组合原因指示模块、指向约束模块和序列学习模块,并根据先验条件,设置情感指示模块,在已知情感子句的前提下,完成对原因子句的识别,完整的构造方式如下方公式所示: 其中对[MASK]cau的预测,即为最终原因子句的预测结果,相应的函数公式如下所示; 3对于条件因果关系分类任务,同时组合指向约束模块和序列学习模块,并根据先验条件,设置情感指示模块和原因指示模块,判断特定文本那情景下,给出的情感子句和原因子句组是否还构成因果关系,完整的构造方式如下方公式所示: 设置投票机制,用于最终预测样本的类别,投票机制具体如下方函数所示: 其中cemo表示情感子句,X表示情感子句集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。