恭喜中国电子科技集团公司第十研究所杨露获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国电子科技集团公司第十研究所申请的专利一种基于框架匹配的百科图谱知识融合方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115098640B 。
龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210796986.2,技术领域涉及:G06F16/36;该发明授权一种基于框架匹配的百科图谱知识融合方法是由杨露设计研发完成,并于2022-07-07向国家知识产权局提交的专利申请。
本一种基于框架匹配的百科图谱知识融合方法在说明书摘要公布了:本发明公开了一种基于框架匹配的百科图谱知识融合方法,该方法将百科知识融合过程划分为逻辑层、数据层知识融合两个阶段。逻辑层数据融合阶段,通过概念对齐、属性统一等过程,实现多来源百科数据逻辑描述统一、语义明确;数据层知识融合阶段,基于框架匹配的结果,通过实体对齐、属性融合,实现不同来源百科图谱实体自动融合。本发明通过对概念一致性判断、概念融合、概念属性融合实现图谱逻辑层数据,输出融合后图谱概念及属性;在逻辑层数据基础上,通过实体对齐、实体属性消歧实现图谱数据层实体及其关系融合,实现多来源数据逻辑统一、语义信息明确,输出融合后的知识图谱,进而最终实现多来源百科图谱数据自动融合。
本发明授权一种基于框架匹配的百科图谱知识融合方法在权利要求书中公布了:1.一种基于框架匹配的百科图谱知识融合方法,其特征在于,所述方法包括以下步骤:S1:获取若干个百科数据库的原始实体数据,存入待融合百科实体列表其中,所述待融合百科实体列表的表达式为:{Xentity}={'labels':[label1,...,labeln],'properties':{'pro1':'pro1_value',...,'pro3':'pro3_value'}}其中,'labels'表示实体的概念列表,labeli表示实体具体所属的概念值,'properties'表示实体的属性,pro1_value与pro3_value分别为属性类型pro1与pro3的属性值;S2:提取每一个待融合百科实体的概念值和属性类型,生成候选概念-属性列表,并依次执行概念对齐和属性融合,获得融合后的概念值、属性类型和融合前的对应表,其中,所述概念对齐,具体包括:S201:构建已融合概念列表fuse_concepts以及融合后概念与原始概念对应表concept_ori2fused,初始均为空;S202:从候选概念-属性列表concepts中任选一概念concept,若已融合概念列表fuse_concepts为空,将concept加入fuse_concepts,否则,执行步骤S203;S203:依次计算concept与fuse_concepts中任一概念fuse_concept的概念值相似度和属性类型相似度,其中,概念值相似度的计算方式包括:设concept、fuse_concept的概念值分别为Lc=[label1c,...,labelnc],Lf=[label1f,...,labelnf],若Lc、Lf为包含关系或Lc、Lf中存在同义词,Lc、Lf的相似度为1;否则依次将Lc、Lf概念值拼接,计算拼接后文本的余弦相似度,若该相似度高于阈值,则说明concept、fuse_concept的概念值相似;S204:根据概念值相似度和属性类型相似度,合并和去重concept、fuse_concept的概念值以及属性类型,更新融合后概念与原始概念对应表concept_ori2fused;S3:根据所述对应表,将待融合百科实体列表中原始实体数据的概念值与属性类型替换为融合后的概念值与属性类型,获得融合实体数据,并根据原始实体数据与融合实体数据的概念相似度与属性相似度执行实体融合,获得融合后的百科实体,所述步骤S3,具体包括:S301:输入待融合百科实体列表{Xentity},基于融合后概念与原始概念对应表concept_ori2fused、融合后属性与原始属性对应表pro_ori2fused,将原始实体数据中的概念值与属性类型替换成融合后的值,并构建已融合实体表fused_entities,初始为空;S302:依次从待融合百科实体列表{Xentity}中任选一实体数据ori_data,若fused_entities为空,将ori_data加入fused_entities,否则执行步骤S303;S303:依次计算实体ori_data与已融合实体表中任一实体fused_entity概念、属性两个维度的相似程度concept_sim、pros_sims;若存在相似度均大于阈值,执行步骤S304,否则,将ori_data加入fused_entities中;S304:合并和去重ori_data、fused_entity两个实体的概念值,并输出融合后百科实体fused_entities;其中,概念值相似度的计算方式包括:将ori_data、fused_entity的概念拼接成字符串,计算拼接后文本的余弦相似度,将该相似度作为两个实体的概念相似度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十研究所,其通讯地址为:610000 四川省成都市金牛区茶店子东街48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。