买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种实体关系联合抽取方法、终端及存储介质。本发明提供的实体关系联合抽取方法首先将目标文本中存在的目标词的词向量对目标文本中每个字符的初始字向量进行处理后得到每个字符的输入字向量,将每个字符的输入字向量作为用于输出实体识别结果的第一神经网络的输入来输出实体识别结果,再根据目标文本的实体识别结果以及目标文本中每个字符的输入字向量来获取用于输出关系抽取结果的第二神经网络的输入,使得两类任务共享目标文本中字符和词的信息,提升了实体和关系联合抽取的准确性。
主权项:1.一种实体关系联合抽取方法,其特征在于,包括:获取目标文本,将所述目标文本中的每个字符转化为初始字向量,并确定所述目标文本中是否存在预训练词向量对应的目标词;若存在,则根据所述目标词的预训练词向量与所述目标词中包括的字符的所述初始字向量,获取所述目标文本中每个字符的中间字向量;将所述目标文本中的每个字符的所述中间字向量和所述目标文本中的各个字符的所述中间字向量之和分别并联,获取所述各个字符分别对应的输入字向量;将所述输入字向量输入至预先训练完成的第一神经网络,通过所述第一神经网络获取所述目标文本的实体识别结果;根据所述实体识别结果与所述输入字向量获取用于输入至预先训练完成的第二神经网络的输入数据,通过所述第二神经网络获取所述目标文本的实体关系抽取结果;其中,所述第一神经网络和所述第二神经网络是通过包括多组训练数据的训练集共同被训练完成的,每组训练数据包括样本文本、样本文本对应的实体标注结果以及样本文本对应的实体关系标注结果;所述根据所述目标词的预训练词向量与所述目标词中包括的字符的所述初始字向量,获取所述目标文本中每个字符的中间字向量,包括:对于所述目标词中包括的字符,将所述目标词的预训练词向量输入至预先训练完成的第三神经网络,在所述第三神经网络中,对所述目标词的预训练词向量进行多头注意力处理,获取所述目标词中各个字符对应的权重,分别按照所述目标词中的字符对应的权重将所述目标词的预训练词向量与各个字符的初始字向量相加,获取每个字符的所述中间字向量;对于不存在对应的目标词的字符,将对应的所述初始字向量作为所述中间字向量;其中,所述第三神经网络与所述第一神经网络、所述第二神经网络共同通过所述训练集训练完成。
全文数据:
权利要求:
百度查询: 深圳市罗湖区人民医院 深圳市大数据研究院 一种实体关系联合抽取方法、终端以及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。