买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东亿云信息技术有限公司
摘要:本发明属于自然语言处理技术领域,提供了一种基于全局信息聚合的实体对齐方法及系统,基于PageRank的算法能够计算三元组中每个实体在整个知识图谱中的相对重要性,将可以更好的利用整个知识图谱的信息。同时,采用PersonalizedPageRank来进行图扩散增强,产生增强的全局视图,并将其用于实体对齐任务中。同时通过对比学习对比图扩散增强和随机扰动增强,能够通过对比学习的方式可以同时学习到图扩散增强视图中的全局信息和随机扰动视图中的局部信息,从优化图谱表示的角度提高的实体对齐的准确性和鲁棒性并取得较好的效果。
主权项:1.一种基于全局信息聚合的实体对齐方法,其特征在于,包括:获取任意两个不同的知识图谱,即第一知识图谱和第二知识图谱;基于预先训练好的实体对齐网络模型,对获取的两个知识图谱进行实体对齐;其中,所述基于预先训练好的实体对齐网络模型,对获取的两个知识图谱进行实体对齐,包括:基于两个知识图谱的大小,生成知识图谱实体和关系的初始化嵌入,即第一知识图谱初始化嵌入和第二知识图谱初始化嵌入;分别将两个知识图谱知识图谱的关系三元组转换成邻接矩阵,即第一邻接矩阵和第二邻接矩阵;基于第一邻接矩阵和第二邻接矩阵进行图扩散,并将生成的图扩散矩阵与两个知识图谱的初始化嵌入相结合,得到对应的图扩散增强图;基于两个知识图谱,根据实体直接相连的边的数量进行筛选,得到对应的结构扰动增强图;利用编码器分别将两个知识图谱的领域信息、关系方向以及全局特征嵌入到对应的图扩散增强图以及结构扰动增强图中,得到对应的图扩散增强嵌入向量以及图扰动增强嵌入向量;根据两个知识图谱的图扩散增强嵌入向量以及图扰动增强嵌入向量之间的欧式距离来判断两个实体对齐关系,最终得到实体对齐结果。
全文数据:
权利要求:
百度查询: 山东亿云信息技术有限公司 一种基于全局信息聚合的实体对齐方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。