Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于融合关系与二维注意力的实体关系抽取方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:人民法院信息技术服务中心;上海交通大学

摘要:本公开涉及自然语言处理技术领域,提供了一种基于融合关系与二维注意力的实体关系抽取方法及装置。该方法包括:获取待识别文本,以预处理得到目标文本;分别对目标文本进行句拆分、词拆分及字符分割,以构建句编码;将句编码输入至实体识别模型,识别实体、实体类别及实体在句子中的位置,并建立对应的文本关系编码;根据文本关系编码以及词集合对应的词向量编码融合,确定融合关系编码;以句子级实体关系为抽取维度,根据融合关系编码,利用二维词级注意力及句子级注意力计算得到二维双重注意力向量矩阵,并根据双向神经网络对二维双重注意力向量矩阵进行解码得到实体关系抽取结果。通过本公开实施例,可提高复杂场景下文书的实体关系抽取精度。

主权项:1.一种基于融合关系与二维注意力的实体关系抽取方法,其特征在于,所述方法包括:获取待识别文本;对所述待识别文本进行预处理,得到目标文本;分别对所述目标文本进行句拆分、词拆分及字符分割,得到句子集合、词集合以及字符分割集合,并根据所述句子集合、词集合以及字符分割集合构建对应的句编码;将所述句编码输入至预训练的实体识别模型,识别实体、实体类别及实体在句子中的位置,并根据所述实体、实体类别及实体在句子中的位置建立对应的文本关系编码;根据所述文本关系编码以及词集合对应的词向量,确定融合关系编码,包括:计算所述文本关系编码与词向量的余弦相似度;根据所述余弦相似度建立对应的余弦相似度向量;将所述余弦相似度向量与所述词向量进行相乘运算,得到所述融合关系编码;以句子级实体关系为抽取维度,根据所述融合关系编码,利用二维词级注意力及句子级注意力计算得到二维双重注意力向量矩阵,并根据双向神经网络对所述二维双重注意力向量矩阵进行解码处理,得到实体关系抽取结果,包括:将所述融合关系编码输入至具有二维注意力层的双向神经网络中,使得所述二维注意力层分别基于词级别的注意力构建二维词级注意力矩阵,基于句子级别的注意力构建句子级注意力矩阵,并将所述句子级注意力矩阵作为加权因子,利用所述加权因子对所述二维词级注意力矩阵进行加权求和,得到二维双重注意力向量矩阵,所述双向神经网络根据所述二维双重注意力向量矩阵对网络权重及网络偏置进行迭代更新,直至达到预设收敛条件,得到所述实体关系抽取结果;其中,所述二维注意力层利用如下公式计算得到二维双重注意力向量矩阵: ;其中,hs*为二维双重注意力的向量矩阵表示,βi为句子级别的注意力权重,X为句子表示下的词级别的注意力向量矩阵,ReLU()为激活函数,ω0为网络权重,b0为网络偏置,f为句子的特征,fFT为句子的特征向量,由f拼接得到,H为双向神经网络输出向量组成的矩阵,HT为H的转置矩阵,并且H=[h1,h2,h3,…,ht],t为句子长度,softmax()及tanh()为激活函数,ws1、ws2为权重矩阵,并且ws1的矩阵大小为da×2u,ws2的矩阵大小为r×da,da为网络中神经元的数量,r为超参数。

全文数据:

权利要求:

百度查询: 人民法院信息技术服务中心 上海交通大学 基于融合关系与二维注意力的实体关系抽取方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。