首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于自步超图学习的小样本图像分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京化工大学

摘要:基于自步超图学习的小样本图像分类方法属于计算机视觉研究领域。本发明利用超图学习作为分类器来推断未标记数据的伪标签,并采用分类可靠性准则来减轻有伪标签噪声的影响。国内外目前还没有类似文献报道。本方法首先引入拉普拉斯算子将原始数据编码到超图空间中,有助于减少分类时对特征的依赖,然后将超图表示投影到标签空间中进行预测。其次,设计了一种自步学习算法,该算法利用引入的超图学习来推断未标记数据的伪标签,并采用分类可靠性准则,即将具有最可靠预测的数据用于更新分类器,这主要是为了减轻有噪声伪标签的影响。本发明在小样本数据集上能达到最高的预测准确率,对小样本图像分类任务具有重要的意义。

主权项:1.基于自步超图学习的小样本图像分类方法,其特征在于包括:超图构建、分类模块、自步超图学习;首先给出小样本学习的定义,在小样本学习中,有两个集合:一个基类集Cbase和一个新类别集Cnovel;两个类别集不重叠,即定义基本数据集和新数据集为Dbase,Dnovel;在预训练阶段,使用Dbase来训练特征提取器;采用Dnovel来评价小样本分类的性能;每个小样本任务都有一个支持集S、一个查询集Q和一个未标记集U;具体步骤如下:1在基于超图的小样本图像分类中,第一步是构造超图;给定m个标记支持样本S和n个未标记的查询样本Q;将这些支持样本和查询样本提取特征得到特征嵌入其中xi表示第i个特征嵌入,d和n+m表示样本的尺寸和数量;超图G=V,E,w由节点集V、边集E和边的权值w组成;每条边e被赋予一个权值we;V中每个节点代表{S,Q}中的一个样本;总共有n+m个节点;在E中,选择最近邻搜索方法来构建超边;每次选择一个节点作为质心,并使用相应的超边e将其与k个最近的相邻节点连接起来;超图G用一个|V|×|E|关联矩阵H表示,矩阵中的每一项定义为 节点v∈V的节点的度计算为: 超边e∈E的超边的度计算为: 然后生成两个对角矩阵Dv和De,对角线上的每一项分别对应于节点的度和超边的度;并且生成对角线矩阵W,对角线上的每一项对应于超边权值;其中,所有超边都是用相同的权值初始化的;2利用构建的超图进行分类;设表示所有训练样本的标签矩阵,其中表示实数,n+m表示样本的数量,nc为数据集的类别数,yi表示第i类的标签向量,对于标记的样本,每行yi将第i类的阳性样本标记为1,将所有其他样本标记为0;对于未标记的样本,所有元素设置为0.5,表示没有关于这些样本类别的先验信息;设表示标签投影矩阵,其中fi表示第i个样本待学习的标签投影向量;超图分类的正则化框架如下: 在上述框架中,λ是平衡超图结构正则项ΩF和经验损失RempF影响的权重参数,正则项ΩF表示为: 式中c表示类别,nc为数据集中的类别数量,e表示超边,E表示边集,we是边的权值,Hu,e和Hv,e为节点u和v的关联矩阵,δe是超边e的度,Fu,c和Fv,c为节点u和v的标签投影矩阵,du、dv分别为节点u,v的度,I为单位矩阵;其中,Dv是由dv组成的度矩阵,De是由δe组成的度矩阵,H是原始超图的关联矩阵,W是由we所组成的权重矩阵,F:,c为所有节点的标签投影矩阵;令Δ=I-Θ,则Δ可视为归一化超图拉普拉斯算子;因此,有正则项ΩF:ΩF=trFΤΔFtr表示矩阵的迹,经验损失项RempF定义为:RempF=||F-Y||2超图学习的任务就变成了最小化以下两项的和:ΦF=trFΤΔF+λ||F-Y||2通过对ΦF关于F求导,得到: 将λ设置为5,通过迭代过程直接求解上述方程;使用学习到的标签投影矩阵F来获得预测标签;3自步超图学习;利用查询数据Q和未标记数据U来提高监督学习的性能;对于转导设置,使用查询数据来优化的分类器,提高查询数据的分类性能;在半监督设置中,利用未标记的数据来优化查询数据Q的分类器;设定f·是预训练阶段在数据库上训练的特征提取器,Dnovel经过特征提取器后的相应嵌入定义为Xnovel=fDnovel=[Xs,Xq,Xu],其中Xs=fS,Xq=fQ,Xu=fU分别表示支持、查询和未标记数据的特征嵌入;过程由三个步骤组成:i利用支持特征Xs构造一个分类器,此分类器通过学习一个标签投影矩阵F来对不同的类别进行分类;接着,通过以下方法预测未标记数据特征的标签: 其中Yu表示预测的未标记数据的伪标签矩阵,Y表示所有训练样本的初始标签矩阵;然后预测U属于第p类:p=idmax{Yu}其中idmax表示向量中最大值对应的索引;ii对伪标签矩阵中的值进行排序,然后选择置信度最高的未标记样本的特征嵌入Xselect,得到相应的标签向量Yselect;将伪标记的样本和标签扩充到支持集;接下来,生成新的超图;步骤描述为:Xs=[Xs,Xselect]Ys=[Ys,Yselect]其中,Ys表示支持集的独热标签矩阵;iii每次选择一个样本更新分类器;重复i,ii,直到选中所有未标记的数据,并对所有未标记数据输出可靠的伪标签矩阵,此时,得到的分类器是最优的,该分类器用于预测查询标签。

全文数据:

权利要求:

百度查询: 北京化工大学 基于自步超图学习的小样本图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。