首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于本体的多粒度城市暴雨内涝知识图谱构建方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明公开了一种基于本体的多粒度城市暴雨内涝知识图谱构建方法,属于知识图谱构建技术领域,进行本体体系的划分,对划分好的本体类别体系进行概念、类属定义,对划分好的本体一级类下进行二三级类的划分,定义实体间的关联关系,形成良好的概念层次知识体系,对数据进行知识抽取,其中知识抽取是将存在于多源数据中的概念、实体及相互之间的关系、属性等知识要素提取出来,将得到的三元组数据存储在Neo4j图数据库,构建基于本体的多粒度城市暴雨内涝知识图谱。推理过程先在粗粒度广度搜素,再在细粒度深度搜索,从而在保证知识图谱推理准确度情况下,有效提高推理的速度,解决了传统知识图谱囿于在整个知识图谱全局推理的局面。

主权项:1.一种基于本体的多粒度城市暴雨内涝知识图谱构建方法,其特征在于,包括如下步骤:S1.进行本体体系的划分,对划分好的本体类别体系进行概念、类属定义,构建知识图谱模式层,本体是结构化知识库的概念模板,利用先验知识进行本体体系划分;对划分好的本体一级类下进行二三级类的划分,定义实体间的关联关系,形成良好的概念层次知识体系;S2.对城市暴雨内涝的地点多粒度分层,构建多粒度知识图谱模式层,把城市暴雨内涝事件的发生地点作为主节点,对发生地点进行分层,各层地点之间以关系相连接;S3.对数据进行知识抽取,其中知识抽取是将存在于多源数据中的概念、实体及相互之间的关系、属性知识要素提取出来,分为命名实体识别、关系抽取,将抽取到实体和关系映射到模式层中,构成一个个三元组数据;S4.将得到的三元组数据存储在Neo4j图数据库,构建基于本体的多粒度城市暴雨内涝知识图谱;所述S1中还包括如下步骤:S101.进行本体体系的划分:根据知识图谱推理理论,结合暴雨内涝预警的特征,城市暴雨内涝知识图谱围绕城市内涝灾害事件、灾情数据、灾情推理任务3个核心要素;S102.对划分好的本体类别体系进行概念、类属细分,完成实体模式层的构建;所述步骤S102中包括以下步骤:S1021.依据简单事件模型理论基础上,得到城市暴雨内涝事件六要素:简单事件模型六要素“5W1H”,何事What、何人Who、何时When、何地Where、何故Why和如何How六要素的基础上,删去“何人Who”要素,添加“程度HowMuch”要素,即内涝灾害名称、时间、地点、原因、灾害程度、预警下个内涝事件六要素;S1022.参考自然灾害系统理论,得到城市暴雨内涝事件属性表述五类别:依据自然灾害系统理论,致灾因子、孕灾环境、承灾体组成了区域灾害系统,三者相互作用而产生灾情,结合自然灾害承灾体分类与代码、自然灾害灾情统计相关国家标准,从灾害事件基本属性、致灾因子、孕灾环境、承灾体以及灾情信息五个方面对城市暴雨内涝灾害事件的属性进行描述;S1023.对知识图谱本体体系的实体进行概念、类属的细分,完成事件模式层的构建,根据城市暴雨内涝事件六要素,属性表述五个类别,分别对城市内涝灾害事件、灾情数据、灾情推理任务三个核心要素进行概念、类属的细分;S1024.定义实体间的关联关系,结合实体模式层,完成构建城市暴雨内涝知识图谱模式层:实体间的关联关系,包括并列关系、层级关系、整体—部分关系、相关关系和因果关系这5种类型,每种类型包含多种描述相应关系的词汇,从而依据语句表征提取准确的关系描述,结合S1023步骤实体模式层,完成构建城市暴雨内涝知识图谱模式层;所述步骤S2包括如下步骤:S201.多粒度知识图谱的分层依据:依据地学知识图谱的时空特性,将粒计算理论引用到地学知识图谱地理地点中,对城市暴雨内涝事件的发生地点进行分层;S202.根据分层依据,对地理地点进行多粒度分层,构建多粒度城市暴雨内涝知识图谱模式层:根据步骤S201所述分层依据,把城市内涝事件的发生地点分成4种不同地点粒度的地点序列:区级、街道级、精确可定位地点、物理线路,从而,在城市暴雨内涝知识图谱模式层基础上,对地理地点分层,构建了多粒度城市暴雨内涝知识图谱模式层;所述步骤S3包括以下步骤:S301.实体抽取:实体抽取从数据集中将相关实体识别抽取出来,可以用于解决互联网文本数据的爆炸式信息过载的问题,采用深度学习进行实体抽取;S302.在实体抽取基础上进行关系抽取:在命名实体识别的基础上,进行关系抽取,使用BiGRU-Attention模型对实体间关系进行抽取,注意力机制对不同输入计算相应权重,将输入值与权重值进行动态相乘;S303.将抽取到的实体和关系数据映射到知识图谱模式层:根据语义相似度,将抽取到的实体、关系映射到步骤S2构建好的多粒度知识图谱本体概念中的实体和关系类型中,得到一个个三元组数据;所述S301包括以下步骤:S3011、中文预分词:基于实体Mask的BERT词向量处理下,在词向量基础上顾及句子级别,BERT模型是结合ELMO和GPT的优势而构造出来的新语言模型,创新性使用遮蔽语言模型和下一步预测2个任务进行预训练,利用先验知识进行相关领域的实体识别,然后将识别出的实体进行Mask,经过操作生成Embedding序列送进Transformer中,提取特征,最后得到语义丰富的词向量,得到句子级别语义特征;S3012、在中文预分词基础上,进行实体抽取:采用BiLSTM-CRF模型,采用BiLSTM模型进一步提升模型利用上下文信息的能力,可以有效标注文本序列和标签之间的关系;CRF能够考虑到相邻标签之间的关系,从而获得全局最优标签序列。

全文数据:

权利要求:

百度查询: 电子科技大学 一种基于本体的多粒度城市暴雨内涝知识图谱构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。