恭喜中南大学王雅琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中南大学申请的专利知识图谱三元组的可靠性评估方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115238582B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210879183.3,技术领域涉及:G06F30/27;该发明授权知识图谱三元组的可靠性评估方法、系统、设备及介质是由王雅琳;林邠;郭静宇;彭渝彬;周泽雄;谭栩杰;王凯;袁小锋;桂卫华设计研发完成,并于2022-07-25向国家知识产权局提交的专利申请。
本知识图谱三元组的可靠性评估方法、系统、设备及介质在说明书摘要公布了:本公开实施例中提供了一种知识图谱三元组的可靠性评估方法、系统、设备及介质,属于数据处理技术领域,具体包括:利用预设嵌入模型训练数据集中的嵌入向量;对数据集进行预处理;利用知识图谱中的类型信息对训练集中每个三元组进行类型约束,并据此计算类型信息置信度;表征训练集中每个三元组的逻辑规则置信度;利用训练完成的嵌入向量计算实体关联置信度;利用训练集中每个三元组中实体对的路径搜索策略及其嵌入向量,求解其全局路径置信度;将每个三元组的类型置信度、逻辑规则置信度、实体关联置信度和全局路径置信度训练二分类神经网络;利用目标识别网络评估待评估三元组的可靠性。通过本公开的方案,提高了三元组可靠性的分类效率和精度。
本发明授权知识图谱三元组的可靠性评估方法、系统、设备及介质在权利要求书中公布了:1.一种知识图谱三元组的可靠性评估方法,其特征在于,包括:步骤1,获取知识图谱的数据集,并利用预设嵌入模型训练数据集中的嵌入向量;步骤2,对数据集进行预处理,以随机替换部分正样本中头实体、尾实体或关系的方式生成负样本,并为正样本和负样本打上标签,将正样本和负样本混合生成训练集;步骤3,利用知识图谱中的类型信息对训练集中每个三元组进行类型约束,并据此计算类型信息置信度;所述步骤3具体包括:步骤3.1,获取知识图谱中每个实体的类型信息和关系的类型信息;步骤3.2,对每一个三元组h,r,t进行类型置信度计算,计算公式如下: Typeh,r,t=prhead,h*prtail,t其中,Th表示头实体h的类型集合,Tt表示尾实体t的类型集合,rhead表示所有存在关系r的头实体集合,表示rhead中所有实体的类型集合,rtail表示所有存在关系r的尾实体集合,表示rtail中所有实体的类型集合,prhead,h表示所有存在关系r的实体对中头实体h的类型和关系类型中包含的全部头实体类型的交集占全部头实体类型的比例,prtail,t表示所有存在关系r的实体对中尾实体t的类型和关系类型中包含的全部尾实体类型的交集占全部尾实体类型的比例,类型信息置信度Typeh,r,t是上述两者的乘积,置信度范围是[0,1];步骤4,依据知识图谱中挖掘到的逻辑规则信息与翻译模型及相关模型的能量函数计算公式表征训练集中每个三元组h,r,t的逻辑规则置信度;所述步骤4具体包括:步骤4.1,利用预设规则挖掘工具挖掘数据集中高置信度的逻辑规则fl表示第l条逻辑规则,λl表示第l条逻辑规则的置信度,λl∈[0,1];步骤4.2,依据能量函数公式和逻辑规则真值计算公式计算fl规则推导出的第q条具体规则gl,q:的得分,公式如下:Ψgl,q=σh,r1,t·σh,r2,t-σh,r1,t+1其中,l表示第l条规则,q表示第q条具体规则,σ·表示sigmoid后的能量函数,计算公式为: 其中,δr是指和关系r有关的阈值变量,||h+r-t||是TransE的能量函数计算公式,h是头实体的嵌入向量,r是关系的嵌入向量,t是尾实体的嵌入向量;步骤4.3,利用上述公式得到以下规则三元组的置信度计算公式: 其中,C是正则系数,表示Ψgl,q关于三元组h,r,t的梯度,使得计算出的置信度范围在[0,1]之间;步骤4.4:整合上述公式,得到以下规则置信度计算公式: 其中,是根据知识图谱已有三元组和逻辑规则推导出的规则三元组集合;步骤5,构建以知识图谱中每个头实体为中心的有向图,并利用训练完成的嵌入向量计算实体关联置信度;所述步骤5具体包括:步骤5.1,获取知识图谱中全部的实体;步骤5.2,以每个头实体h为中心构建有向图,并在搜索深度K内构建子图,资源将通过迭代分配到整个有向图中的其他节点,直到资源稳定,即可得到各个节点的资源量;步骤5.3,结合头实体h和尾实体t的出、入度、尾实体t的节点深度和资源量得到实体关联置信度;步骤6,利用训练集中每个三元组中实体对的路径搜索策略及其嵌入向量,求解其全局路径置信度;所述步骤6具体包括:步骤6.1,搜索知识图谱中每个三元组的头实体和尾实体两点间的所有可达路径;步骤6.2,依据预设算法计算每条可达路径的路径评分;步骤6.3,选取每个三元组中路径评分最优的前K条可达路径,将前K的可达路径的嵌入向量送入递归神经网络,计算该三元组的全局路径置信度;步骤7,将每个三元组的类型置信度、逻辑规则置信度、实体关联置信度和全局路径置信度训练二分类神经网络,得到目标识别网络;步骤8,利用目标识别网络评估待评估三元组的可靠性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中南大学,其通讯地址为:410000 湖南省长沙市岳麓区麓山南路932号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。