买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工程大学
摘要:一种基于注意力的语义图划分方法,涉及计算机集群图计算技术领域。本发明是为了解决现有图划分方法还存在图划分质量低、语义汇聚度低的问题,从而导致后续图计算速度慢、计算任务执行效率低以及通信成本高的问题。本发明包括:获取语义图,从语义图中提取图结构数据和语义特征数据,然后对语义特征数据降维;构建基于注意力的语义图划分网络,将图结构数据和降维后的语义特征数据输入基于注意力的语义图划分网络,获得语义图划分方案;构建异构感知的高纬度优先图划分网络,利用语义图划分方案划分语义图,获得划分结果,将划分结果输入到异构感知的高纬度优先图划分网络中对语义图进行二次划分,获得最终图划分方案。本发明用于图划分。
主权项:1.一种基于注意力的社交网络图划分方法,其特征在于所述方法包括以下步骤:步骤一、获取语义图A,并从语义图A中提取图结构数据和语义特征数据,然后对语义特征数据降维,具体为:步骤一一、利用语义图A中的各用户编号组成节点集V=v1,v2…vn,然后扫描微博社交网络图中的用户间的联系,每两个用户之间的联系组成边集,将节点集和边集转换为DGLGraph图结构数据;所述语义图为微博社交网络图;其中,i,j∈[1,n],n是用户的总个数;步骤一二、采用词袋模型表示微博社交网络图A中每一个用户的语义特征信息,然后利用PCA降维方法对语义特征信息降维,获得降维后的语义特征信息,具体为:利用One-Hot编码表示语义图中每个用户的所有属性,然后获取属性个数,为每个用户vi生成向量;其中,用户vi生成的向量长度为用户的属性总个数,若当前用户存在当前属性,则向量中当前属性的位置上的值为1,若当前用户不存在当前属性,则向量中当前属性的位置上的值为0;所述用户的属性包括:职业、年龄、讨论倾向、参与领域;步骤二、构建基于注意力的语义图划分网络,将步骤一获得图结构数据和降维后的语义特征数据输入基于注意力的语义图划分网络,获得语义图划分方案;所述基于注意力的语义图划分网络包括:语义图嵌入子单元、语义图划分子单元;所述语义图嵌入子单元为多注意力神经网络;语义图嵌入子单元将步骤一获得语义特征信息嵌入到图结构数据中,获得嵌入语义特征的图结构数据其中,i∈[1,n],n是微博社交网络中用户的总个数,F'是嵌入图结构数据中的语义特征信息的维度,是嵌入语义特征的图结构数据中用户vi的语义特征信息;所述语义图划分子单元包括:全连接层、softmax层;语义图划分子单元划分嵌入语义特征的图结构数据,获得各用户所在分区的概率矩阵Y;所述各用户所在分区的概率矩阵中的元素为坐标,横坐标为索引,纵坐标为节点所在分区的概率;步骤三、利用步骤二获得的语义图划分方案划分微博社交网络图A,获得划分结果,将划分结果输入到异构感知的高纬度优先图划分网络中对微博社交网络图A进行二次划分,获得最终的图划分方案;所述异构感知的高纬度优先图划分网络包括:节点负载均衡子单元、通信成本最小化子单元;所述节点负载均衡子单元:获取将划分结果中待分配的边分配到每个分区的负载均衡得分,如下式: 其中,γ是控制负载权重参数;max和min分别是当前拥有最大负载的子图的负载值和当前拥有最小负载的分区的负载值,|p|是当前计算的分区的负载值,Calp是当前分区所在计算用户的计算能力,∈是常数,一般为1,|E|则是当前在所有分区中的总边数,P是分区集;所述通信成本最小化子单元:获得划分结果中待分配的边分配到每个分区的通信得分,如下式: 其中,[gvi,p+gvj,p+1]是复制因子的得分值,Avi、Avj分别是所有包含用户vi、vj的子图的集合,x,y是两个不同的分区,gvi,p、gvj,p0是中间变量,为用户vi、vj的归一化度数值,是当前分区所在计算节点到用户vi所在分区计算节点的归一化通信成本,是当前分区所在计算节点到用户vj所在子图计算节点的归一化通信成本,CommSmaxSx,Sy是计算节点之间的最大通信成本,是子图p所在计算节点到用户vi所在计算节点的通信成本,是子图p所在计算节点到用户vj所在计算节点的通信成本。
全文数据:
权利要求:
百度查询: 哈尔滨工程大学 一种基于注意力的社交网络图划分方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。