买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西北工业大学
摘要:本发明公开了一种基于锚点图拉普拉斯秩优化的自监督图像数据聚类方法,首先构建基于二步跃迁概率的二部图矩阵并得到能够表征原始数据局部信息的小规模锚点相似度矩阵。接着,将求得的锚点相似度矩阵为基准,建立基于秩约束和逼近策略的锚点相似度矩阵优化模型,求得目标连通分量的锚点相似度矩阵进而直接获取所选锚点的伪标签。最后,通过K近邻算法将锚点伪标签向全样本传播以得到最终聚类结果。本发明通过基于自适应参数更新的秩约束优化锚点相似度矩阵,相比于传统图聚类方法的固定图学习模式泛化性能更强,显著提升了图像数据聚类效率,能够有效提升数据聚类准确率。
主权项:1.一种基于锚点图拉普拉斯秩优化的自监督图像数据聚类方法,其特征在于,包括如下步骤:步骤1:将n×p×q规模的图像数据集拉长为一个数据矩阵其中n为图像个数,p和q分别为图像的横向和纵向像素规模,d=p×q为像素总数;步骤2:对矩阵X进行下采样,通过层级二分K均值算法获取m个覆盖原始数据点的稀疏锚点,生成锚点数据矩阵再通过如下自适应构图模型学习稀疏二部图矩阵 其中,bj为二部图矩阵的第j列,bij为第i个图像向量xi与第j个锚点向量zj的相似度,γ0为正则化参数,1n为n维全1向量;式1的闭式解为: 其中,k为每个锚点的近邻样本数,xk+1为第j个锚点向量zj的第k+1近邻样本向量,xj'为zj的第j'近邻样本向量j'=1,2,...,k;在求解式1时,参数γ0能够自适应确定;步骤3:计算小规模锚点相似度初始矩阵其中Θ为对角矩阵,且Θ的第i个对角元素为二部图矩阵B的第i行行和,记为θi,即小规模锚点相似度矩阵满足二步跃迁概率准则,即: 其中,pxi|zu为第u个锚点zu向第i个样本点xi的跃迁概率,pzv|xi为第i个样本点xi向第v个锚点zv的跃迁概率;biu为xi与zu之间的相似度,由于二部图矩阵B的列和为1,因此biu直接表示从zu到xi的跃迁概率,即biu=pxi|zu;biv为xi与zv之间的相似度,由于B的行和并不是1,需要通过θi对biv执行行和归一化以表示从xi到zv的跃迁概率,即bivθi=pzv|xi;步骤4:将步骤3得到的锚点相似度矩阵A作为初始矩阵,构建基于秩约束的锚点相似度矩阵优化模型,其公式化表述如下: 其中,S为待优化的锚点相似度矩阵,rankLS=m-c为基于锚点相似度矩阵的拉普拉斯秩约束,旨在获得拥有c个连通分量的S进而直接得到数据聚类结果;1m为m维全1向量,S1m=1m表明相似度矩阵满足概率意义;由于秩约束的非凸特性,将式4进一步化简得到: 其中,λ为秩约束正则化参数;计算初始拉普拉斯矩阵LS=D-AT+A2,D为AT+A2的度矩阵,且第j,j=1,2,...,m个对角元素为AT+A2行和;步骤5:更新锚点指示矩阵H,当相似度矩阵固定时,式5等价于: 其中,最优由LS的最小c个特征值对应特征向量组成;步骤6:更新锚点相似度矩阵S,当锚点指示矩阵固定时,优化问题5等价于: 其中,式8中不同锚点间相互独立,对于su得如下等价优化问题: 步骤7:通过以下规则更新正则化参数λ:1若rankLSm-c,则表明S连通分量数少于c个,则令λ←2λ,并返回步骤5;2若rankLSm-c,则表明S连通分量数多于c个,则令λ←λ2,并返回步骤5;3若rankLS=m-c,表明连通分量恰好为c个,则直接得到m个锚点的伪标签并进行步骤8;步骤8:采用K近邻算法将锚点伪标签向全样本扩散:对于任一样本点,查找最近的K个锚点,基于K个锚点的伪标签进行投票,获得最高票数的伪标签即为该样本点的最终标签。
全文数据:
权利要求:
百度查询: 西北工业大学 基于锚点图拉普拉斯秩优化的自监督图像数据聚类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。