买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林化工学院
摘要:本发明公开一种基于改进ViT的高效细粒度图像分类模型。所述方法包括:S1:使用预处理模块处理原始图像数据集;S2:通过模型将图像切分为互不重叠的16×16的小图块;S3:经过局部补丁遮蔽器LPC模块对小块图像中的信息区域进行随机选取并进行遮蔽处理,进而生成全新的小块图像;S3:提取每个小图块的特征向量令牌,同时引入位置编码和分类令牌;S4:使用特征选取模块对每个令牌进行比较,选取与分类器头具有较高相似度的令牌;S5:通过transformer模块从每层编码器的输出中,与分类令牌融合;S6:使用分类预测模块对融合特征进行分类预测,构建全新焦点平滑损失函数FSLoss进行训练,通过不断更新参数和迭代训练,优化模型性能,直至模型收敛。这些步骤使分类模型能够更加准确地捕获图像中局部区域,提取了图像背景中的有效信息并去除噪音,有效提高了分类准确性。
主权项:1.一种基于改进ViT的高效细粒度图像分类模型,其特征在于,包括以下步骤:步骤1:输入图像数据集到模型的主干网络中,将图像切割成16×16的小块图像;步骤2:基于局部补丁遮蔽器LPC模块对小块图像中的信息区域按比例进行随机选取,并对选取的部分进行遮蔽处理;步骤3:提取每个小图块的特征向量令牌,同时引入位置编码和分类令牌;步骤4:使用深度特征选取模块DFS对每个token进行比较,选取与分类器头具有较高相似度的令牌;步骤5:通过transformer模块从每层编码器的输出中,与分类令牌融合;步骤6:使用分类预测模块对融合特征进行分类预测,构建全新FSLoss损失函数进行训练,最后得到分类结果。
全文数据:
权利要求:
百度查询: 吉林化工学院 一种基于改进ViT的高效细粒度图像分类模型
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。