首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

应用可信度感知迭代训练策略实现实体对齐的方法、系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学

摘要:本发明属于人工智能技术领域,具体涉及一种应用可信度感知迭代训练策略实现实体对齐的方法及其对应的服务推荐系统。该方案的核心包括一个关系感知交互图注意力网络,以及一个基于可信度感知迭代训练的自监督机制。其中,图注意力网络用于提取知识图谱中实体和关系的嵌入表示,并可以聚合实体特征和关系特征,并利用注意力机制降低噪声对实体嵌入的影响。在自监督机制中,先由图注意力网络分别提取出两个待对齐处理的知识图谱的嵌入表示,然后不断评估两个知识图谱中各组预对齐实体对的可信度,并将可信度高的实体对逐渐添加为伪对齐种子。本发明克服了现有方案需要依赖大量人工标注的伪对齐种子且易受噪声影响进而导致模型精度不足的缺陷。

主权项:1.一种应用可信度感知迭代训练策略实现实体对齐的方法,其特征在于,其用于对任意两知识图谱中的指定实体进行对齐,其包括:S1:获取包括大量知识图谱的样本数据集,并对所述样本数据集中各知识图谱包含的所有实体和关系信息进行索引编号;S2:利用关系感知交互图注意力网络提取所述样本数据集中任意两个指定的知识图谱G1和G2的语义信息、关系信息和结构特征,并根据提取到的信息生成知识图谱中各个实体e的最终表示;S3:根据每个实体的最终表示计算分属于知识图谱G1和G2的任意两实体的相似度S,并评估由两个不同来源的实体构成的预对齐实体对的可信度c;过程如下:S31:将任意两实体之间的曼哈顿距离的相反数作为二者的相似度,计算分属于G1和G2的任意两实体的相似度,构成一个相似度矩阵D;S32:将所述相似度矩阵D中相似度排名靠前的对应实体ei和ej作为预对齐实体对;S33:从所述相似度矩阵D中筛选出所述预对齐实体对中的其中一个实体ei与另一知识图谱中除ej以外其余实体的次优相似度,以及所述预对齐实体对中的另一个实体ej与另一知识图谱中除ei以外的其余实体的次优相似度;S34:分别计算出最优相似度与两个所述次优相似度的差值,计算结果记为单向可信度;S35:将两个单向可信度的均值作为评估实体ei和ej能否构成对齐实体对的可信度;S36:重复步骤S32-S35,依次将所述相似度矩阵D中相似度大于一个指定的相似度阈值的各组实体作为预对齐实体对,并计算所述预对齐实体对的可信度;S4:在分属于两知识图谱的任意两实体的可信度超过预设的可信度阈值时,在两实体之间添加一个表征二者等同的伪标签;S5:选择所述样本数据集中的其余知识图谱,重复执行步骤S3-S4,对所述关系感知交互图注意力网络进行迭代训练,并将每一轮获得的伪标签作为后续训练过程中的监督信息,以提升所述关系感知交互图注意力网络的训练效果;S6:保存训练完成后的关系感知交互图注意力网络,并将其用于对任意两知识图谱中的指定实体进行对齐。

全文数据:

权利要求:

百度查询: 安徽大学 应用可信度感知迭代训练策略实现实体对齐的方法、系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。