买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆大学;重庆市沙坪坝区人民医院
摘要:本发明涉及一种面向缺少训练样本场景的食物视觉识别方法,该方法使用对抗擦除策略自动发现图像中的成分并学习更全面的表示。该方法包括两个分类器,分别挖掘目标的不同区域。首先,使用一个分类器识别和擦除中间特征图上的局部判别区域。然后,将已擦除的特征输入到另一个分类器中,以发现有关目标的互补信息。此外,使用软标签而非成分标签来监督第二个分类器,从而减少由于样本中不可见的成分而引起的模型偏差。在两个基准数据集上进行了实验证明,包括Food‑101和VIREOFood‑172,并展示了RER相对于最先进的FSFR方法的更好性能。
主权项:1.一种面向缺少训练样本场景的食物视觉识别方法,其特征在于:包括如下步骤:S1:获取基础数据集:获取若干食物图像构建基础数据集xi表示第i张食物图像,yi表示第i张食物图的独热类别标签,yi∈Cbase,Cbase表示基础数据集中的类别集合,Nbase表示基础数据集的总样本数目;S2:构建和训练识别模型:该识别模型由特征提取、特征擦除和特征重激活三个组件组成;特征提取:采用卷积神经网络,作为共享的特征提取器,给定图像和其独热类别标签yi∈Cbase,将卷积神经网络应用于提取其中间特征图: 其中,c,h和w分别表示通道数、高度和宽度,fθx表示卷积神经网络;然后,通过使用分类器AgA和全局平均池化GAP来获得预测标签计算预测标签与实际标签yi之间损失特征擦除:在应用全局平均池化GAP之前,将获得最后的卷积特征图表示为其中L×L是空间尺寸,K是通道数,给定类别激活图Mc的类激活图c定义为:其中是相对于类别ith的第c个通道的权重;通过将Mc归一化到范围[0,1],并通过超参数σ设置一个阈值,将Mc转换为二进制掩码来实现特征擦除,根据二进制掩码擦除vi中的区分性区域,并获得擦除后的特征图其中⊙表示逐元素的乘法;特征重激活:分类器BgB的输入是擦除后的特征图用于预测分类分数计算软标签与预测分类分数之间的损失所述即分类器A在前一个时期的输出logits;当识别模型的总损失不再变化时,得到训练好的识别模型;S3:对于未知实物图像,将该未知实物图像输入训练好的识别模型中,得到未知实物图像属于各独热类别的概率值,将概率值采用降序排列,输出前Top-k。
全文数据:
权利要求:
百度查询: 重庆大学 重庆市沙坪坝区人民医院 一种面向缺少训练样本场景的食物视觉识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。