买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东南大学
摘要:本发明公开了面向多源异构建筑人文史料的建筑师知识图谱构建方法。首先,对近现代建筑师群体史料的互联网数据和纸质文献进行采集和处理,同时手工构建建筑师图谱本体。然后,以建筑师图谱本体为指导,采用词法分析、规则抽取和深度学习的方法分层次抽取半结构化和非结构化多模态数据中的实体、关系和事件等不同粒度的建筑师相关知识,并将抽取得到的多源异构知识进行融合。最后,得到由知识三元组构成的近现代建筑师知识图谱,并将其存储于图数据库中。近现代建筑师知识图谱可有效提升传统建筑人文史料梳理和分析的工作效率,具有较好的应用前景。
主权项:1.面向多源异构建筑人文史料的建筑师知识图谱构建方法,具体步骤如下,其特征在于:1多源异构建筑人文史料数据的采集:一方面,采集纸质建筑师文献数据Dp;另一方面,采集来源于互联网开源建筑人文数据Dw,通过设计的专用网络爬虫算法,对纸质文献中的建筑师数据进行补全、更新或修正;2)多源异构建筑人文史料数据的处理:针对采集的纸质文献资料,通过文本识别、文本纠错以及文本规范化处理,将建筑师纸质文献数据转换成结构化数据;进而,针对互联网上的建筑师相关网页,通过正则化处理,抽取得到建筑师信息并保存为数据;因此,建筑师资料库信息;3)建筑师图谱本体构建:建筑师图谱本体是对建筑师知识图谱中数据的形式化概念抽象描述和定义,建筑师知识图谱本体OA包括对象的类型、属性和关系的类型、以及类型层次,基于步骤1和步骤2中得到的建筑师信息首先分析各类数据组成成分,定义对象-属性类型和关系-属性类型词典,并结合建筑人文基础研究的需求进行调整,最终定义了10种对象类型,30种属性类型和23种关系类型;建筑信息到建筑师知识图谱GA以预定义的本体OA为支撑,用于精确描述建筑师人文知识图谱;4)建筑师知识抽取:以实体、关系、事件为知识粒度抽取建筑师知识,对于半结构化的数据,采用词法分析和规则抽取的知识抽取方法,通过分析半结构化文本语句将其转化为词序列并标记各词的词性,然后以预定义建筑师规则模式识别出实体、关系、事件知识,针对非结构化文本数据,采用深度学习法学习获取建筑师文本特征,并根据预定义建筑师实体类型和关系类型抽取实体、关系三元组,以及根据预定义建筑师事件类型和论元角色抽取事件知识。
全文数据:
权利要求:
百度查询: 东南大学 面向多源异构建筑人文史料的建筑师知识图谱构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。