首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向引文网络数据的基于稀疏图学习的图卷积聚类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京工业大学

摘要:本发明公开了面向引文网络数据的基于稀疏图学习的图卷积聚类方法,该方法在图卷积网络的每个图卷积层前面嵌入了一个稀疏图结构学习层,挖掘高维数据中的低维结构从而构建更优的图结构。在模型优化时,交替更新图结构和节点表示,减少不准确的图结构对图卷积网络带来的负影响,最终对得到的节点表示执行K‑Means获得最终的聚类结果。相比于现有的固定图结构的图卷积深度聚类方法,不断更新的图结构对边攻击更加鲁棒。本发明从节点表示中学习自适应图来提高原始图结构的质量。所使用的持续更新的图结构可以有效地帮助生成更全面和更具有判别性的节点特征。最后,逐层交替的更新图结构和节点表示可以有效缓解图卷积网络中过平滑的问题。

主权项:1.面向引文网络数据的基于稀疏图学习的图卷积聚类方法,其特征在于:该方法在三个公开图数据集上进行评估,包括DBLP、ACM和CITE数据集;该方法包括以下步骤:1首先设计面向引文网络数据的图结构学习层,引进稀疏表示的思想,从节点表示中学习能够反映节点之间相似性的稀疏图结构;2根据构建好的图结构进行图卷积操作来获取聚合了高阶邻居节点特征的节点表示;3对最终获取的节点表示执行K-Means聚类;1面向引文网络数据的图结构学习层为学习引文网络数据的稀疏自表示矩阵Zl,定义面向引文网络数据的图结构学习层的损失函数如下, diagZl=0,Hl-1=ZlHl-1+El,1其中,矩阵Hl-1是第l-1层自适应图卷积层学习到的数据表示,反映引文网络数据的节点i和节点j之间的相似性,矩阵El表示引文网络数据的重构误差,1是一个全1的列向量Zl1=1,α是一个大于0的惩罚系数,其取值范围为{0.01,0.1,1,10,20},diagZl=0使得矩阵Zl的对角线元素为0;将l0范数放宽为l1范数, diagZl=0,Hl-1=ZlHl-1+El2利用乘法器交替方向法来求解,提出一个图结构滤波机制;a.首先利用收缩阈值操作符来滤除Zl中权重较小的边, 其中,max·提取矩阵中最大的元素,sgn·是符号函数;b.为直观反映引文网络数据的样本之间的连接关系,将Zl转换为0-1矩阵, 其中定义为, c.获取对称关联矩阵, d.认为图标准化有助于数值稳定性,因此,对关联矩阵Zl执行标准化,Zl=D-1Zl+I,6其中,D是度矩阵,I是单位矩阵;将学习到的关联矩阵和引文网络数据的初始图结构进行融合,得到更新的引文网络数据的第l层的图结构Al, 超参数∈的取值范围为{0.1-0.9};2自适应图卷积层;为学习到一个适用于聚类任务的高质量节点表示,将学习到的图结构Al和节点表示Hl-1编码到一个统一的图卷积层中;定义自适应图卷积层为,Hl=σAlHl-1Wl,8其中,Wl表示可学习的权重矩阵,σ表示一个非线性激活函数,这里选择RELU;H0=X,其中,X是输入引文网络数据的属性特征;值得注意的是,所提出的自适应图卷积层和主流的图卷积层的区别在于图结构是变化的;将学习到的节点表示Hl视为新的节点特征,然后将其送入图结构学习层去学习高质量的图结构Al;3目标函数和聚类任务为了保证学习到的节点表示能够包含更多的初始输入的引文网络数据的有效信息,通过最小化引文网络数据的属性特征重构损失和引文网络数据的图结构重构损失来优化网络系数, 其中,超参数γ的取值范围为{0.01,0.1,1,10},是由自适应图卷积层的最后一层生成的引文网络的重构数据特征,是由的内积构成的引文网络的重构图结构, 最后进行优化求解,得到最优的中间层节点表示HL2,并对其执行K-Means来获取最终的聚类结果C*,C*=K-MeansHL2。

全文数据:

权利要求:

百度查询: 北京工业大学 面向引文网络数据的基于稀疏图学习的图卷积聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。