买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及一种基于伪元路径生成的联邦异构图表示学习方法及系统,属于联邦异构图表示学习技术领域,通过引入伪元路径生成、联邦异构图融合和联邦参数聚合方法,将异构图表示学习方法很好地融入进联邦学习架构中,通过联邦学习的架构来提升模型性能。本发明通过客户端伪元路径生成,解决了联邦异构图表示学习中跨客户端的结构信息缺失问题。本发明通过共享伪元路径而不是本地真实数据,可以保障客户端的本地数据隐私,每个客户端的本地真实异构图都不会被其他客户端或者中心服务器获取,在很好地提升模型性能的同时,极大地提升联邦异构图表示学习方法中对客户端本地数据隐私的保护能力。
主权项:1.一种基于伪元路径生成的联邦异构图表示学习方法,其特征在于,包括如下步骤:ST1:从公开的异构图数据集中选择不同规模的数据集,并按照比例分配给参与联邦学习的每个客户端,同时切断跨客户端的边,以得到每个客户端本地异构子图数据集,客户端将本地异构子图数据集划分为训练集、验证集和测试集;其中,所有客户端在本地异构子图数据集上遵循着相同的学习任务,并使用相同结构的异构图表示学习模型,并且所有客户端使用相同定义的元路径来进行本地的学习任务;ST2:客户端基于本地异构子图数据集构造基于关系的伪邻居节点生成器,构建损失函数,优化生成的伪邻居节点,使其接近真实邻居节点的表示;ST3:利用基于关系的伪邻居节点生成器,客户端按照所有客户端都遵循的相同定义的元路径中的节点关系顺序,将本地异构子图中的真实节点作为起始节点,生成一些伪节点,并将起始节点和生成的伪节点按顺序连接成为伪元路径,客户端将生成的伪元路径加入本地异构子图训练集中,形成本地补充子图;ST4:客户端将本地生成的伪元路径中全部伪节点和其拓扑结构上传至中心服务器,中心服务器接收每个客户端的伪节点和拓扑结构,对每两个来自不同客户端的相同拓扑位置的节点,构建相似度矩阵;ST5:中心服务器构建相似节点评估规则,基于相似节点评估规则聚类相似节点,并把相同的伪元路径结构赋予给来自不同客户端的相似节点;ST6:中心服务器将每个客户端增加的来自其他客户端的伪节点和伪元路径结构发送给相应客户端,客户端接收新增的来自其他客户端的伪节点和伪元路径结构,并将它们加入到本地补充子图中,形成联邦补充子图;ST7:基于本地训练集,客户端构建伪标签预测器,构建伪标签预测目标函数,优化预测的伪标签和真实标签接近;ST8:客户端用伪标签预测器预测新增的伪节点标签,进一步完善联邦补充子图的标签集,将联邦补充子图和其全部标签作为异构图表示学习模型的训练数据;ST9:客户端本地训练一个异构图表示学习模型,异构图表示学习模型基于异构图注意力网络结构,分别在节点级和语义级使用注意力机制,并利用元路径来学习节点间的复杂关系,通过设置超参数权衡不同部分的权重,得到最优的本地目标模型表达式和本地模型参数;ST10:客户端将最优的本地模型参数上传至中心服务器,中心服务器接收来自不同客户端的本地模型参数,通过差分隐私联邦平均方法来聚合这些本地模型参数,以形成全局模型参数;ST11:中心服务器将全局模型参数发送给每个客户端,客户端接收全局模型参数,并使用全局模型参数更新本地模型;ST12:客户端在真实的本地异构子图训练集上进一步微调更新后的本地模型,然后将新的本地模型参数上传至中心服务器;ST13:中心服务器和客户端重复上述参数聚合、发送全局模型参数、本地微调和上传本地模型参数的过程,直至全局模型性能达到收敛;ST14:客户端将待学习的真实的本地异构子图通过最优的本地异构图表示学习模型表达式,学习到图中节点的嵌入表示,并进一步应用于下游任务。
全文数据:
权利要求:
百度查询: 山东大学 一种基于伪元路径生成的联邦异构图表示学习方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。