河北工业大学;天津农学院郭迎春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河北工业大学;天津农学院申请的专利基于特征细化自监督学习的广义零样本图像分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117095196B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310723100.6,技术领域涉及:G06V10/764;该发明授权基于特征细化自监督学习的广义零样本图像分类方法是由郭迎春;张玉;崇浩泽;朱叶;于洋;师硕;吕华;阎刚;刘依设计研发完成,并于2023-06-19向国家知识产权局提交的专利申请。
本基于特征细化自监督学习的广义零样本图像分类方法在说明书摘要公布了:本发明为基于特征细化自监督学习的广义零样本图像分类方法,该方法引入自监督学习任务,为SwinTransformer网络添加了两个分类头,主要用于解决对可见类别的偏见问题。通过旋转角度分类任务和对比学习任务,增强了视觉特征定位,加强了视觉特征和语义信息的相关性,同时为了进一步缓解偏见问题,在训练样本构建中为未见类生成伪标签,从而将GZSL任务设置为直推式学习。
本发明授权基于特征细化自监督学习的广义零样本图像分类方法在权利要求书中公布了:1.一种基于特征细化自监督学习的广义零样本图像分类方法,该方法包括如下步骤: 1获取广义零样本分类模型的图像数据集和语义属性数据集,利用ResNet101网络训练语义属性数据集获得语义特征A; 2构建一个以图像数据集和语义属性数据集为输入的条件视觉分类器,为未见类的图像生成伪标签,将得到的伪标签作为未见类的标签,以图像数据集中的未见类图像和通过条件视觉分类器获得的伪标签构成新的图像数据集,将图像数据集中的可见类的图像数据集、未见类图像和伪标签构成新的图像数据集作为广义零样本分类模型的训练样本,用于后续的分类训练; 3构建广义零样本分类模型; 所述广义零样本分类模型包括视觉特征细化模块、语义特征细化模块、添加了两个分类token的SwinTransformer网络和构建的两个自监督学习任务,两个新添加的分类token分别对应两个自监督学习任务:旋转角度分类任务和对比学习任务,其中旋转角度分类任务需要将训练样本随机旋转四个不同的角度,最后预测旋转类别;对比学习任务是将训练样本分别输入ResNet101和SwinTransformer网络中得到经过不同特征提取器提取的视觉特征,通过对比损失函数进行约束; 构建视觉特征细化模块:所述视觉特征细化模块是基于双线性池化的思想改进的,是特征融合的一种改进方法,采用的是同源双线性池化的方法,视觉特征细化模块的输入是训练样本经SwinTransformer网络后得到的视觉特征x,视觉特征细化模块使视觉特征更适用于细粒度数据集,包括哈达玛操作、reshape操作、全连接层和归一化层,具体操作是复制视觉特征x用于后续的特征融合,x初始维度是q,两个视觉特征x经reshape操作后维度分别变换为1×q和q×1,命名为x1和x2,x1分解为参数矩阵U1和特征向量x2分解为参数矩阵U2和特征向量参数矩阵U1和特征向量的乘积是x1,特征向量和参数矩阵U2的乘积是x2,然后U1和U2经哈达玛操作输入到全局向量层中,和同样经哈达玛操作输入到全局向量层中,并在全局向量层中聚合成全局向量z,再经一个全连接层和归一化操作,输出为细化后的视觉特征 构建语义特征细化模块:所述语义特征细化模块称为图像自适应IAS模块,IAS模块将用于类间区分的原始语义特征与用于类内变化的图像特定注意向量相结合,然后将图像自适应语义特征映射到相对应的视觉空间中,从而提升了GZSL图像分类的准确度;IAS模块包括第1全连接层FC、第1分类函数softmax、哈达玛操作、和操作、第2全连接层、第3全连接层FC、第1归一化层、第2归一化层、第2分类函数softmax,IAS模块的输入为视觉特征细化模块输出的视觉特征和利用ResNet101网络训练语义属性数据集获得的语义特征A,视觉特征经第1全连接层FC、第1分类函数softmax处理后的结果与语义特征执行哈达玛操作、和操作,获得改进后语义特征改进后的语义特征经过第2全连接层FC、第3全连接层FC及第2归一化层处理后与视觉特征x经第2归一化层处理后的结果执行哈达玛操作及第2分类函数softmax处理,将语义特征映射到视觉空间中; 以训练样本输入SwinTransformer网络,依次经视觉特征细化模块和IAS模块中,输出广义零样本图像分类任务的分类类别,训练广义零样本分类模型,广义零样本分类模型的总损失函数为自监督学习的损失函数和广义零样本分类任务的损失之和,自监督学习的损失函数包括旋转角度分类任务的损失函数和对比学习任务的损失函数,公式表示为: 其中,为广义零样本分类模型的总损失函数,为旋转角度分类任务的损失函数,为广义零样本分类任务的损失函数,为对比学习任务的损失函数; 广义零样本分类任务的损失函数为: 其中,M代表训练样本个数,yi和分别代表真实标签和广义零样本图像分类任务的预测标签; 旋转角度分类任务的损失函数为: 其中,表示旋转角度分类任务的预测标签,a∈{0,1,2,3}代表4个旋转角度; 对比学习任务的损失函数为: 其中,M代表训练样本个数,分别代表训练样本经过ResNet101网络和SwinTransformer网络后的视觉特征,W代表SwinTransformer网络的权重矩阵,代表之间的相似性; 至此,获得训练好的广义零样本分类模型; 4利用训练好的广义零样本分类模型对广义零样本图像进行识别,完成广义零样本的分类任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河北工业大学;天津农学院,其通讯地址为:300130 天津市红桥区丁字沽光荣道8号河北工业大学东院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。