首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于图卷积和机器阅读理解的事件论元提取方法、系统及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南理工大学

摘要:本发明公开了基于图卷积和机器阅读理解的事件论元提取方法、系统及介质,方法为:构造多关系事件图;获取多关系事件图中所有节点的初始化特征矩阵;使用关系型图卷积RGCN并结合注意力机制自动学习,获得事件结构感知的节点特征信息;根据输入语句嵌入事件触发词的位置获取上下文特征表示,使用事件结构感知的节点特征信息构造问题;根据上下文特征表示与问题特征表示计算相似度矩阵及注意力,使用流注意机制生成问题感知的上下文特征表示;采用自注意机制及论元匹配算法完成事件论元的提取。本方法考虑了不同事件类型和论元角色之间的关系,通过构建多关系图来联合建立多类型事件类型和论元角色之间的复杂关系,使得有效提高提取事件论元的性能。

主权项:1.基于图卷积和机器阅读理解的事件论元提取方法,其特征在于,包括下述步骤:获取事件本体,以事件类型和论元角色为节点,构造多关系事件图;所述多关系事件图MREG表示为:g=V,ε,R其中,V是节点集合,由事件类型节点和论元角色节点组成;ε是节点之间边的集合,表示两个节点之间存在关系连接;R是关系类型集合;所述多关系事件图中的每条边用一个三元组表示v1,v2,r∈ε,其中v1,v2∈V,r∈R,代表节点v1和节点v2之间是具有关系连接的边,且边的类型为r;所述关系类型包括三种类型:1事件类型-事件类型ET-ET,即在任意两个事件类型节点之间连边;2事件类型-论元角色ET-AR,即根据事件本体的定义,在事件类型节点及其对应的一组论元角色节点之间连边;3论元角色-论元角色AR-AR,即在任意两个论元角色之间连边;使用语言模型BERT作为特征提取器,获取多关系事件图中所有节点的初始化特征矩阵;所述获取多关系事件图中所有节点的初始化特征矩阵,具体为:使用语言模型BERT作为特征提取器,为多关系事件图中每个节点初始化特征表示,公式为: 其中,d为语言模型BERT最后隐藏层输出的维度大小,[CLS]和[SEP]是语言模型BERT中的特殊字符,代表矩阵;对多关系事件图中所有节点进行初始化处理,得到所有节点的初始化特征矩阵: 其中ei,0i≤m表示第i个节点的初始化特征表示,m是节点总数;使用关系型图卷积RGCN对多关系事件图进行学习更新,并结合注意力机制自动学习邻居节点的自适应注意力权重,获得事件结构感知的节点特征信息;所述获得事件结构感知的节点特征信息,具体为:利用关系型图卷积RGCN对多关系事件图进行学习更新,并结合注意机制来自动学习邻居节点的自适应注意力权重,将该过程记为RGAT;当进行第L层RGAT时,计算任意两个节点vi和vj的相关性得分Sij,公式为: 其中,是第L层节点vi的特征向量,是第L层节点vj的特征向量,是可学习的参数矩阵;表示向量拼接操作;σ·是非线性激活函数;利用特定关系类型r∈R下的邻接矩阵作为注意力计算的掩码,计算在关系r下的节点vi的邻居节点的注意力权重 其中是节点vi在关系r下的邻居节点集;使用注意力权重将邻居节点的特征表示加权聚合到中心节点vi并更新vi的特征,公式为: 其中是在第L层RGAT更新后的节点vi的特征向量输出,和是第L层RGAT中可学习的参数;是归一化常数;是第L层节点vj的特征向量,当时,是节点vi在关系r下的邻居节点vj在第L层输入的特征向量;经过L层RGAT的学习,获得事件结构感知的节点特征信息,表示为: 其中,是事件感知结构的节点特征信息,表示节点vi经过L层RGAT后输出的节点特征,0i≤m,m是节点总数;根据输入语句嵌入事件触发词的位置获取上下文特征表示,使用事件结构感知的节点特征信息构造问题;根据上下文特征表示与问题特征表示计算相似度矩阵及注意力,使用流注意机制生成问题感知的上下文特征表示;基于问题感知的上下文特征表示,采用自注意机制及论元匹配算法完成事件论元的提取。

全文数据:

权利要求:

百度查询: 华南理工大学 基于图卷积和机器阅读理解的事件论元提取方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。