一种基于渐进式互指导的组合零样本图像分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学

摘要：本发明涉及计算机视觉图像零样本分类领域，提供一种基于渐进式互指导的组合零样本图像分类方法，包括：将训练图像输入到预训练好的视觉特征提取器中提取到多尺度的基元特征（属性特征和对象特征）；将多尺度的基元特征输入深度神经分类网络中进行渐进式互学习，得到训练好的模型，迭代此过程，逐步得到精确的网络模型；将图像对应的标签通过词嵌入转换为文本特征，与视觉特征进行对齐；对预测的模型和文本计算松弛交叉熵损失，优化网络模型；将测试集输入到优化后的模型中，通过三个不同分支的平衡得到预测结果。本发明能够大幅度提高对于看不见组合的分类精度，同时缓解了组合零样本任务存在的泛化性和情境性问题，使图像分类更加准确。

主权项：1.一种基于渐进式互指导的组合零样本图像分类方法，其特征在于，包括以下步骤：步骤100，训练，将训练图像x输入到预训练好的视觉特征提取器ResNet18；步骤101，基元视觉特征提取，用不同的卷积层提取训练好的ResNet18的中间层特征分别得到多尺度的原始的属性视觉特征和原始的对象视觉特征步骤200，迭代基元与组合互指导过程，迭代次数i∈[1,N]；步骤201，属性指导组合，当前尺度下融合后的属性视觉特征从解耦属性分支输入到耦合组合分支；步骤202，对象指导组合，当前尺度下融合后的对象视觉特征从解耦对象分支输入到耦合组合分支；步骤203，耦合，对于同一尺度下的融合后的属性视觉特征和融合后的对象视觉特征通过双注意力组合生成模块DACG进行特征融合得到当前尺度下的组合视觉特征；步骤204，组合指导属性，关注于属性的组合视觉特征从耦合组合分支返回到解耦属性分支指导属性视觉特征的融合；步骤205，组合指导对象，关注于对象的组合视觉特征从耦合组合分支返回到解耦对象分支指导对象视觉特征的融合；步骤206，解耦，组合指导的基元视觉特征来自三部分：分别是当前尺度下的特征前一尺度保留的融合后的基元视觉特征以及用于指导的组合视觉特征重复步骤201～206；渐进式互指导网络PMGNet包括多尺度视觉特征的提取、基元视觉特征和组合视觉特征的相互指导两个部分；对于多尺度视觉特征的提取，选择步骤100中的预训练好的视觉特征提取器ResNet18；对于基元视觉特征和组合视觉特征的相互指导，主要由三个相互依赖的分支组成分别是：解耦属性分支、解耦对象分支和耦合组合分支；在步骤201中，解耦属性分支是渐进式互指导网络PMGNet中负责对属性进行分类的分支；接收从预训练的视觉特征提取器ResNet18多个残差块的特征图，通过1×1卷积、3×3卷积和全局池化得到的多个尺度下的属性视觉特征作为输入，并输出在组合视觉特征的指导下融合了不同尺度下属性视觉特征的属性特征该分支通过与对应的属性文本特征ya计算损失函数来优化属性视觉特征；公式表示如下：其中，a表示目标图像所预测的属性文本标签，表示属性预测范围内的其他属性文本标签，A表示全部属性预测文本标签的集合，η为标量用于控制Softmax激活函数分布的峰值，γ控制松弛的程度，范围在0～1之间；对于不同尺度下属性视觉特征的融合，在组合视觉特征的指导下，选择当前尺度下的属性特征，前一尺度下的属性特征在当前尺度下进行可学习的加权求和，公式表示如下：其中，分别代表解耦属性分支中前一尺度传来的融合后的属性视觉特征所占的权重、当前尺度下原始的属性视觉特征所占的权重以及组合指导属性分支所占的权重；在步骤202中，解耦对象分支是渐进式互指导网络PMGNet中负责对对象进行分类的分支；接收从预训练的视觉特征提取器ResNet18多个残差块的特征图，通过1×1卷积、3×3卷积和全局池化得到的多个尺度下的属性视觉特征作为输入，并输出在组合视觉特征的指导下融合了不同尺度下对象视觉特征的对象特征该分支通过与对应的对象文本特征yb计算损失函数来优化对象视觉特征；公式表示如下：其中，b表示目标图像所预测的对象文本标签，表示对象预测范围内的其他对象文本标签，B表示全部对象预测文本标签的集合，η为标量用于控制Softmax激活函数分布的峰值，γ控制松弛的程度，范围在0～1之间；对于不同尺度下对象视觉特征的融合，在组合视觉特征的指导下，选择当前尺度下的对象特征，前一尺度下的对象特征在当前尺度下进行可学习的加权求和，公式表示如下：其中，分别代表解耦对象分支中前一尺度传来的融合后的对象视觉特征所占的权重、当前尺度下原始的对象视觉特征所占的权重以及组合指导对象分支所占的权重；在步骤203中，耦合组合分支是渐进式互指导网络PMGNet中负责对组合进行分类的分支；接收多个尺度下属性视觉特征和对象视觉特征作为输入，通过采用双注意力组合生成模块DACG融合得到组合视觉特征该分支通过与对应的组合文本特征ym计算损失函数来优化组合的视觉特征；公式表示如下：其中，m表示目标图像所预测的组合文本标签，表示组合预测范围内的其他组合文本标签，M表示全部组合预测文本标签的集合，η为标量用于控制Softmax激活函数分布的峰值，k控制松弛的程度，范围在0～1之间；在步骤203中，融合基元视觉特征得到组合视觉特征的方法如下：通过采用双注意力组合生成模块DACG，鼓励生成两个不同的组合视觉特征；具体来说，把第i个尺度下的融合后的属性视觉特征和融合后的对象视觉特征作为输入，首先计算它们的哈达玛积，然后通过Softmax激活函数得到组合的注意力分数，将得到的注意力分数与所要关注的基元视觉特征进行哈达玛积再和另一个基元视觉特征进行元素级相加，通过全连接的学习即可得到带有注意力的组合视觉特征，考虑属性和对象之间的关系；DACG的操作用公式表示为：其中表示关注于属性的组合视觉特征，表示关注于对象的组合视觉特征，表示组合指导融合后的属性视觉特征，表示组合指导融合后的对象视觉特征，表示哈达玛积，表示元素级相加，Softmax表示Softmax激活函数，FC表示全连接层；在步骤206中，组合指导基元视觉特征解耦，方法如下：利用生成的组合视觉特征和来分别指导解耦属性分支和解耦对象分支进行解纠缠，同时保留组合的情境性；具体来说，通过将组合视觉特征添加到解耦属性分支中的原始的属性视觉特征和前一尺度传来的融合后的属性视觉特征中进行加权求和，就能够得到语义更加丰富的基元视觉特征，既包含细粒度特征，又包含与另一个基元视觉特征之间的纠缠，同样的操作也在解耦对象分支中执行；于是将这种操作公式化为：其中，分别代表解耦属性分支中前一尺度传来的融合后的属性视觉特征所占的权重、当前尺度下原始的属性视觉特征所占的权重以及组合指导属性分支所占的权重；分别代表解耦对象分支中前一尺度传来的融合后的对象视觉特征所占的权重、当前尺度下原始的对象视觉特征所占的权重以及组合指导对象分支所占的权重；步骤300，文本特征提取，将图像的属性标签a和对象标签b通过词嵌入转换为特征向量得到对应的属性文本特征ya和对象文本特征yb；步骤301，文本特征融合，将属性文本特征ya和对象文本特征yb拼接在一起输入到多层感知机MLP中得到组合的文本特征ym；步骤400，训练loss，最终的视觉特征和对应的文本特征在同一个嵌入空间中计算松弛交叉熵损失RCEloss；步骤401，平衡loss，平衡基元分支的loss和组合分支的loss，优化渐进式互指导网络PMGNet；步骤500，使用优化后的渐进式互指导网络PMGNet来测试图像；步骤501，组合标签预测，组合标签由一个属性加一个对象组成；将图像输入到渐进式互指导网络PMGNet中，通过解耦属性分支、解耦对象分支和耦合组合分支分别得到预测的属性分数、对象分数和组合分数，通过平衡这三个分数得到一个综合分数，选取综合分数最大的标签作为图像预测的组合标签。

全文数据：

权利要求：

百度查询：大连理工大学一种基于渐进式互指导的组合零样本图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种骨科导针导向装置

下一篇：一种防爆配电装置的控温结构

相关技术

一种骨科导针导向装置

一种防爆配电装置的控温结构

指纹识别组件及智能门锁

一种吸入式制剂、迭代优化流程及其应用

半导体存储器件

一种口罩总泄漏率检测仪

一种旋转式真空泵

轨对轨输入级电路及运算放大器

考虑可替代物料和切换成本的智能生产排程系统和方法

一种低测试成本的退役动力电池快速筛选方法

烹饪设备

用于治疗胰腺癌的帕特胺A衍生物

样本相关技术

样本架传输装置_安图实验仪器(郑州)有限公司_202110782660.X

唾液样本处理装置_黑龙江亦鸣医学检验实验室有限公司_202323099566.8

样本生成方法及装置_赞塔(杭州)科技有限公司_202410953322.1

一种样本提取装置_中量国康(广东)生命科技发展有限公司_202420297311.8

微流控样本分析仪_深圳迈瑞动物医疗科技股份有限公司_202410743741.2

小规模样本集图像增广模型构建方法_电子科技大学(深圳)高等研究院_202410071434.4

一种生物样本自助存取装置_中国医学科学院北京协和医院_202420617766.3

样本检测装置及流动室制备方法_深圳市帝迈生物技术有限公司_202410720481.7

一种妇科用肿瘤病理样本存取装置_儋州市人民医院_202411066533.X

一种唾液样本收集检测装置_黑龙江亦鸣医学检验实验室有限公司_202323099613.9

组合相关技术

组合物_出光兴产株式会社_202380024436.1

牙科组合物_登士柏希罗纳有限公司_202080066392.5

树脂组合物_味之素株式会社_202410391904.5

树脂组合物_味之素株式会社_202410391909.8

润肤剂组合物_嘉吉公司_202380023616.8

抗衰老组合物_普罗基莱弗公司_202380027004.6

固化性组合物_迈图高新材料日本合同公司_202080081813.1

汽车组合物_博里利斯股份公司_202180057074.7

药物组合及其用途_苏州亚盛药业有限公司_202410268709.3

清洁组合物_宝洁公司_202180010414.0

图像相关技术

图像处理装置、放射线图像摄影系统、图像处理方法及记录介质_富士胶片株式会社_201980094253.0

图像读取电路、图像读取方法、图像传感器以及终端设备_华为技术有限公司_202080090751.0

图像处理装置、图像处理方法以及存储介质_卡西欧计算机株式会社_202080066138.5

图像处理装置及图像传感器控制方法_星宸科技股份有限公司_202410866602.9

图像处理装置、图像处理方法和程序_索尼集团公司_201980088666.8

移动图像整合方法及移动图像整合系统_瑞昱半导体股份有限公司_201910872974.1

显示设备及其图像处理方法与其图像处理装置_联咏科技股份有限公司_202310453003.X

图像畸变校正装置与图像畸变校正方法_星宸科技股份有限公司_202410882859.3

恢复图像的方法_西安万宏电子科技有限公司_202010051781.2

图像形成装置_佳能株式会社_202410396700.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于渐进式互指导的组合零样本图像分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务