买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军国防科技大学
摘要:本发明公开了一种基于prompt的事件论元抽取方法及系统,方法包括:将原始文本输入到预先通过训练的实体识别模型中,识别得到原始文本中的所有实体以及实体在原始文本中开始的位置和结束的位置span;将原始文本输入到预先通过Prompts训练的事件论元抽取模型中,识别得到原始文本中的每个实体所属的论元角色类型;基于原始文本中的每个实体所属的论元角色类型,对论元角色的论元span进行校正。本发明在事件论元抽取时,生成的提示能够同时记录触发词信息、事件类型信息、事件多种论元信息、事件多种论元角色信息,进而满足了事件论元多种角色的准确识别需求。
主权项:1.一种基于prompt的事件论元抽取方法,其特征在于,包括:将原始文本输入到预先通过训练的实体识别模型中,识别得到所述原始文本中的所有实体以及实体在所述原始文本中开始的位置和结束的位置span;将所述原始文本输入到预先通过Prompts训练的事件论元抽取模型中,识别得到所述原始文本中的每个实体所属的论元角色类型;基于所述原始文本中的每个实体所属的论元角色类型,对论元角色的论元span进行校正;其中,将原始文本输入到预先通过训练的实体识别模型中,识别得到所述原始文本中的所有实体以及实体在所述原始文本中开始的位置和结束的位置span,包括:将长度为n的原始文本X={x1,x2,...,xn}输入到预先通过训练的实体识别模型的BERT中,获取输入序列中每个token的词向量W={w1,w2,...,wn};将所述词向量W={w1,w2,...,wn}输入到预先通过训练的实体识别模型的前馈神经网络层中,利用pi=FFNwi计算每个词向量属于不同实体类别标签的概率向量P={p1,p2,...,pn};将所述概率向量P={p1,p2,...,pn}输入到预先通过训练的实体识别模型的条件随机场,根据得分公式计算输入序列映射到所有可能输出实体标签序列的得分,再通过最大化公式得到输入序列的最优标签序列Y’,其中,yi,ti分别表示xi映射到标签ti的非标准化概率,表示从ti转移到ti+1的转移得分,其中A的权重在CRF训练过程中获得并得到更新,T是所有可能标记路径的集合;结合所述最优标签序列Y’和所述原始文本的输入序列X,得到输入序列中存在的实体以及实体span信息。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 一种基于prompt的事件论元抽取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。