买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安理工大学
摘要:本发明公开了一种面向人机协作装配任务的知识图谱构建方法,步骤包括:1建立面向人机协作装配的知识图谱构建流程图;2进行装配知识资源的采集;3将采集到的装配知识统一预处理成自然语言文本的形式;4对预处理过的自然语言文本语料进行句法分析;5采用“基于规则模板的方法”规则,从句法分析的结果中进行信息抽取;6采用“实体匹配”的方法对信息抽取得到的三元组数据进行知识融合;7对数据层中的知识进行概念化抽象得到模式层知识,用本体库进行管理;8将数据层和模式层知识以属性图模型的方式存储在图数据库Neo4j中,并以图结构的形式进行可视化。本发明方法简介有效,逻辑性强,具有广泛的应用价值。
主权项:1.一种面向人机协作装配任务的知识图谱构建方法,其特征在于,按照以下步骤实施:S1:分析实际的人机协作装配任务,得到具体的知识图谱构建流程图;S2:从不同渠道采集不同模态、不同结构的原始装配数据;S3:将采集到的多源异构装配数据统一预处理成自然语言文本的形式;S4:采用LTP语言技术平台对预处理过的自然语言文本语料进行句法分析,包括分词、词性标注、命名实体识别、依存句法分析和语义角色标注;S5:采用“基于规则模板的方法”设计规则,从句法分析的结果中进行信息抽取,包括实体抽取、关系抽取和属性抽取,对于三元组的定义如下:设知识图谱为G,头实体为H,尾实体为T,头实体-尾实体之间的关系为R,实体标签为L,实体属性为V,关系属性为P,则将这些要素组织在一起,定义结构化三元组的表达式为:G=[H:L{ATT:V}]-R{ATT:P}-[T:L{ATT:V}]具体过程是:S51:从依存句法分析的结果中进行关系抽取,得到语料中包含的核心谓词和关联谓词,即实体抽取的备选特征词,其中,依存句法分析的结果以序号1,序号2,关键词的形式表示,具体包含以下小步骤:S511:如果关键词是HED,序号2用0表示,则序号1所指代的那个词就作为核心谓词,有且仅有一个;S512:如果关键词是COO,且序号2所指代的那个词是核心谓词,则序号1所指代的那个词就作为关联谓词,可以有多个关联谓词;S52:依据装配过程需要设计规则,从备选特征词集合中剔除掉不符合要求的特征词,剩余的词作为连接头实体和尾实体的关系特征词R;S53:依据语义角色标注的结果,从语料中去匹配每个关系特征词R所对应的主语和宾语,得到结构化三元组的头实体H和尾实体T,其中,语义角色标注的结果以序号1,[(关键词,序号2,序号3),……]的形式表示,关键词所指代的词的范围在[序号2,序号3]区间内,具体包含以下分步骤:S531:如果序号1所指代的词是关系特征词R,且既存在用关键词A0或者ARGM-MNR标识的词H,又存在用关键词A1标识的词T,则词H作为关系特征词R对应的头实体抽取,词T作为关系特征词R对应的尾实体抽取;S532:如果序号1所指代的词是关系特征词R,且既存在用关键词A1标识的词H,又存在用关键词A2标识的词T,则词H作为关系特征词R对应的头实体抽取,词T作为关系特征词R对应的尾实体抽取;S533:如果序号1所指代的词是关系特征词R,且只存在用关键词A2标识的词H,则词H作为头实体抽取;S534:在实体抽取时,添加额外的三元组,具体方式如下:S5341:如果三元组[H,R,T]中的头实体H用关键词ARGM-MNR标识,且修饰词H的使动词是“用”,则在该条三元组抽取完成后,自动添加三元组[操作者,使用,H];S5342:如果三元组[H,R,T]中的头实体H用关键词A2标识,则在该条三元组抽取完成后,自动添加三元组[操作者,拿,H];S54:在实体属性抽取过程中,依存句法分析的结果以序号1,序号2,关键词的形式表示,具体包括以下小步骤:S541:如果关键词是ATT,且序号2所指代的词包含在头实体或尾实体列表中,则表示序号1所指代的词与序号2所指代的词存在状中关系,那么抽取序号1所指代的词作为序号2所指代词的一个属性值V;S542:如果关键词是SBV,且序号2所指代的词包含在头实体或尾实体列表中,则表示序号1所指代的词与序号2所指代的词存在主谓关系,那么抽取序号1所指代的词作为序号2所指代词的一个属性值V;S55:在关系属性抽取过程中,语义角色标注的结果以序号1,[(关键词,序号2,序号3),……]的形式表示,具体包括以下分步骤:S551:如果序号1所指代的词是关系特征词R,且关键词是ARGM-ADV,则表示区间[序号1,序号2]所指代的部分在语料中作关系特征词R的状语,那么抽取[序号1,序号2]所指代的部分作为关系特征词R的一个属性值P;S552:如果序号1所指代的词是关系特征词R,且关键词是ARGM-TMP,则表示序号1所指代的词在语料中作关系特征词R的时间状语,那么抽取序号1所指代的词作为关系特征词R的一个属性值P;S6:采用“实体匹配”的方法对信息抽取得到的三元组数据进行知识融合,以消除实体指称项的多样性和歧义性问题,包括实体消歧和共指消解,具体过程是:S61:利用聚类方法构建各实体的分类集合,将语义信息相近的实体归为一类,进而得到各分类集合的高维向量表示;S62:利用分词结果得到实体指称项E的高维向量表示,以BERT预训练模型为基础,相同的实体指称项在不同的上下文环境中具有不同的向量表示;S63:计算每个实体指称项和分类集合之间的余弦相似度cosA,E,表达式为: ;S64:根据余弦相似度的值来进行实体消歧,解决实体指称项的歧义性问题;如果cosA,E>cosB,E,则归为实体的分类集合A,否则归为实体的分类集合B;S65:在构建知识图谱前,根据百科资料事先建立一个实体字典库,由多个键值对组成,每个键值对的key值是实体指称项E的官称,value值是一个列表库,里面包含的是实体指称项E的偏称;S66:依据实体匹配的结果来进行共指消解,以此来解决实体指称项的多样性问题;S7:对数据层中的知识进行概念化抽象得到模式层知识,用本体库对这些知识进行管理;S8:将数据层和模式层知识以属性图模型的方式存储在图数据库Neo4j中,并以图结构的形式进行可视化,进而得到面向人机协作装配的知识图谱。
全文数据:
权利要求:
百度查询: 西安理工大学 面向人机协作装配任务的知识图谱构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。