首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于上下文感知的文档级关系抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:郑州信息科技职业学院

摘要:本发明公开了一种基于上下文感知的文档级关系抽取方法,包括以下步骤:A:获取文档中每个单词经连接操作后的单词嵌入;B:获取单词编码后的单词向量:C:获取文档中所有单词的实体节点,并穷举各个实体节点之间的边;D:获取实体节点所在句子的最终嵌入;E:获取文档的上下文信息表示;F:获取实体节点的隐藏表示;G:获取实体节点的最终表示;H:获取文档中实体对内的两个实体节点之间关系类型的概率;I:使用二元交叉熵定义损失函数:J:利用损失函数通过关系图卷积网络,求取每个实体对所对应的概率最大的关系类型作为实体对所属的关系类型,完成文档级关系抽取。本发明能够准确进行文档级关系抽取,实现实体对之间准确的关系预测。

主权项:1.一种基于上下文感知的文档级关系抽取方法,其特征在于,依次包括以下步骤:A:对文档中所包含的每个单词,依据单词与实体类型的相似度概率匹配出每个单词对应的最优及次优的实体类型,然后对单词嵌入进行连接并经线性函数处理,得到每个单词经连接操作后的单词嵌入xj;B:将步骤A得到经连接操作后的单词嵌入xj送到BERT编码器中,得到每个单词编码后的单词向量:C:根据步骤A中得到的单词所对应的最优及次优的实体类型,依据每个实体类型所对应的一个或多个提及,得到最优及次优的实体类型所对应的所有提及,然后根据最优及次优的实体类型所对应的所有提及的数量差,分别采用平均池化和最大池化操作计算得到单词的实体节点;最终得到文档中所有单词的实体节点,并穷举各个实体节点之间的边;D:获取规范化处理后的单词向量,然后根据单词对实体节点的上下文影响程度,为每个单词分配不同的权重;并利用相同单词在不同句子中的不同上下文表示,确定相同单词在不同句子中的不同单词向量;最后通过聚合获取实体节点所在句子的最终嵌入Si;E:采用自注意力机制获取文档的上下文信息表示c;F:通过动态门机制,根据步骤D中得到的规范化处理后的单词向量和最终嵌入Si,以及步骤E中得到的文档的上下文信息表示c,分别对句间关系和句内关系进行抽取,得到第i个实体节点的隐藏表示;G:利用步骤F得到的实体节点的隐藏表示来构建文档图,并利用邻居结点获取文档图中所有实体节点信息,聚合得到实体节点的最终表示;H:通过聚合步骤C中得到实体节点和步骤G中得到的实体节点的最终表示,获取文档中实体对内的两个实体节点之间关系类型的概率;I:使用二元交叉熵定义损失函数:J:利用步骤I中设定的损失函数,通过关系图卷积网络进行训练,分别求取出文档中每个实体对所对应的概率最大的关系类型,作为实体对所属的关系类型,最终完成文档级关系抽取。

全文数据:

权利要求:

百度查询: 郑州信息科技职业学院 一种基于上下文感知的文档级关系抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。