Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京航空航天大学洪志宇获国家专利权

恭喜南京航空航天大学洪志宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京航空航天大学申请的专利一种基于实体语义强度的知识图谱中知识不一致性检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114077675B

龙图腾网通过国家知识产权局官网在2025-04-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111294142.X,技术领域涉及:G06F16/36;该发明授权一种基于实体语义强度的知识图谱中知识不一致性检测方法是由洪志宇;马宗民设计研发完成,并于2021-11-03向国家知识产权局提交的专利申请。

一种基于实体语义强度的知识图谱中知识不一致性检测方法在说明书摘要公布了:本发明公开了一种基于实体语义强度的知识图谱中知识不一致性检测方法,包括:首先对知识图谱进行数据预处理,并对知识不一致性做出形式化定义,利用实体对关联强度、三元组语义相似距离、关系与实体的结合程度三种策略挖掘知识三元组潜在的实体关联强度信息,将知识不一致性的检测看作是一个分类问题,识别出知识所属的类别,以类别为依据实现对知识不一致性的全面检测;本发明可以有效检测出知识图谱的多种不一致性,对于知识图谱的知识质量的改进起到重要作用,进而可以推动知识图谱下游任务的实施。

本发明授权一种基于实体语义强度的知识图谱中知识不一致性检测方法在权利要求书中公布了:1.一种基于实体语义强度的知识图谱中知识不一致性检测方法,其特征在于,所述方法包括:步骤S1、对知识图谱数据集进行预处理,首先根据知识图谱中实体的类型信息,增加类型三元组作为所述知识图谱数据集的补充,接着根据负样本生成原则生成负样本;步骤S2、将步骤S1中经过预处理后的数据集中的知识图谱抽象成图模型的表示形式,根据头实体能到达的节点抽取实体子图,利用实体子图上的资源信息流动表示实体对之间的关联强度;步骤S3、获取三元组中实体和关系在低维向量空间上的表示,计算其余弦相似度以表示头实体到尾实体的语义相似值;步骤S4、统计三元组中关系对应的尾实体在知识图谱中的出现频率,并根据关系和尾实体的结合程度衡量关系对应三元组的路径可信度;步骤S5、根据步骤S2中确定的三元组的关联强度、步骤S3中确定的语义相似值以及步骤S4中确定的结合程度构建特征工程,利用多分类器训练不一致性识别模型,完成所有可能不一致性类型的识别;所述步骤S1具体包括:步骤S101、将知识图谱中实体所属类型信息转换成三元组表示形式,以保证知识图谱中数据的完全性;步骤S102、根据知识图谱中知识的三元组表现形式以及知识图谱构建过程中出现的问题,所述知识图谱构建过程中出现的问题具体包括:自然语言处理过程中出现的词汇相似问题、实体抽取中出现的冗余问题、知识融合中出现的一词多义问题、多数据源导致的数据冲突问题,对所述的知识不一致进行划分,其中,对于目标三元组h,r,t,其相应的不一致性具体包括:关系不一致性: 实体不一致性: 类型不一致性: 其中,G表示知识图谱所含知识,E、R分别代表知识图谱中的实体集和关系集,h,t∈E,r∈R;步骤S103、根据步骤S102中的三种类型的不一致性,以及特征,按照1:1方式生成不一致性的负样本,其中,所述特征具体为:在知识图谱构建过程中,相似的实体与其对应的关系,发生错误映射时,所表示的特征;实体不一致性、关系不一致性、类型不一致性的所对应的负样本的比例为:25%、12.5%、12.5%;所述步骤S2具体包括:步骤S201、遍历知识图谱中每一条三元组,以三元组中的实体为节点、关系为边构建知识图谱的有向图表示;步骤S202、对于知识图谱中的每个实体,使用深度优先搜索遍历找到该实体能连接到的实体集,并记录实体搜寻路径,以此构建实体子图;步骤S203、对于知识图谱中的每个三元组,根据其头实体所在实体子图中的资源流动情况,计算头实体流动到尾实体的信息分配值,即表示该三元组中实体对之间的关联强度,其中,该信息分配值计算表达式如下: 公式中,Ei-1·,e表示经过路径ri到达e的直接前驱节点集合,Eie′,·表示以ei为前驱经过路径ri的直接后继节点集合,We′e表示边e′→e的权重,权重取决于连接e′与e的边的数量;θ是为了避免闭环问题设置的超参,设置为0.15;所述步骤S4具体包括:步骤S401、对于每一条目标三元组,统计关系和尾实体在知识图谱数据集中的出现频率;步骤S402、于每一条目标知识三元组,统计知识图谱数据集中尾实体位于宾语位置的出现频率;步骤S403、根据尾实体的出现频率以及关系和尾实体的共现频率计算关系和尾实体的结合程度,其中该结合程度的表达式为: 公式中,O·表示·的出现频率,Co·表示e和r的共现频率,e表示三元组中的头实体或尾实体,r表示三元组中的关系;所述步骤S5具体包括:步骤S501、根据步骤S203中确定的三元组的关联强度、步骤S302中确定的语义相似值以及步骤S403中确定的结合程度构建特征向量,代表该三元组蕴含的语义信息特征;步骤S502、根据步骤S501中确定的语义信息特征及其知识特征,利用多分类器进行训练模型,完成知识的不一致性检测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。