买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国地质大学(武汉)
摘要:本发明属于构建多模态知识图谱技术领域,公开了一种构建领域多模态知识图谱方法及系统,首先利用NER实体命名识别技术在形成多模态古生物知识图谱中用作实体抽取方向。因为知识图谱类并没有大量应用在古生物领域,由此诸多应用于古生物中的识别提取语料库存在部分缺漏。所以本发明创新点之一在于运用较先进的TPLinker模型对古生物信息的实体‑关系提取形成为下游任务充当语义库的知识图谱;本发明集合文献中图表与内容有关古生物实体关系,创建高效的多模态可视化知识图谱,一定程度上提高该方面研究人员针对古生物信息定位。本发明构建多模态知识图谱的重要作用在于充分提取文献中的文本数据与视觉数据,使知识图谱充分融合图表信息后增强科学性。
主权项:1.一种构建领域多模态知识图谱方法,其特征在于,包括以下步骤:步骤一,对PDF文献进行数据处理,文本与图表对齐,通过对得到的精确古生物信息进行实体抽取与图表分离再提取两个重要剥离信息方法,形成古生物数据图谱库;步骤二,再对爬取文献进行数据处理,文本与图表对齐,通过对得到的精确古生物信息进行实体抽取与图表分离再提取两个重要剥离信息方法,形成古生物数据图谱库;步骤三,选择关系-实体联合抽取模型TPlinker作为文本的ner-re操作,在预训练学习方面,通过使用Linux环境下的手工标注工具brat标注事先准备好的一千个txt文档中存放的句子,再对文本进行关系-实体抽取数据,形成特定关系的三元组集合;步骤四,基于neo4j数据库构图制作详细可实的知识图谱。
全文数据:
权利要求:
百度查询: 中国地质大学(武汉) 一种构建领域多模态知识图谱方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。