一种基于稀疏注意力InterWindow块的Light Swin图像分类方法

导航：龙图腾网> 最新专利技术> 一种基于稀疏注意力InterWindow块的Light Swin图像分类方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：武汉科技大学

摘要：基于稀疏注意力InterWindow块的LightSwin图像分类方法，步骤包括：首先，对图像数据集进行Mixup、水平翻转、随机剪裁等图像增强处理，并打上相应的标签，然后使用SwinTransformer预训练模型进行训练，获取图像的低维度分层特征表示，接着使用基于稀疏注意力InterWindow块进行训练，强化图像的空间特征表示，最后利用分类器对提取的特征进行处理，得到最终的图像分类结果。本发明提出的LightSwin模型结合了CNN架构和Transformer架构的优势，实现了轻量化的高效特征提取，同时，在预训练阶段，本发明采用了l∞范数控制模型注意力权重的稀疏程度，使得模型能够自我调节注意力分布，提高了图像分类的准确率和预测速度。

主权项：1.一种基于稀疏注意力InterWindow块的LightSwin图像分类方法，其特征在于包括以下步骤：步骤1使用图像分类数据集对模型进行预训练，其步骤如下：步骤1.1使用Mixup的方法对图像数据进行图像增强操作：Mixup操作后的图像和标签计算公式：其中xi和xj表示数据集中的原始图像数据，yi和yj对应图像的独热标签，λ为服从Beta分布的概率值，范围为0-1，和表示为Mixup操作后新生成的图像数据和对应图像标签，通过随机选取数据集中图像数据，即可得到图像增强后的图像分类数据集；步骤1.2对数据集图像输入数据随机裁剪、水平翻转和标准化预处理操作；步骤2基于SwinTransformer预训练模型对图像进行预处理，包括以下步骤：步骤2.1利用输入层将步骤1中得到的图像数据输入到模型的SwinTransformer层中，输入的图像数据的形状为：其中表示输入的图像数据，B为输入图像的批量大小，H、W为输入图像的高度和宽度，3表示输入图像为RGB的三通道图像数据；步骤2.2对输入的图像数据使用SwinTransformerblock分阶段进行特征提取，在第一个阶段输入特征图被缩放成大小，其中C为设定的初始维度。从第二阶段开始每经历一个阶段输入特征的的高宽减半，特征维度数翻倍，最终输出的特征图形状为；其中表示输出的图像数据，B为输入图像的批量大小，为输入图像的高度和宽度，4C表示输出图像的维度；步骤3将步骤2中得到的数据输入到InterWindow块，包括以下步骤：步骤3.1InterWindow块首先将特征图分成不重叠的窗口，在窗口内进行一次注意力计算，并将结果与捷径分支相加，由于注意力计算不改变图像数据形状，输出的图像数据形状仍为步骤3.2将图像数据按不重叠窗口的相对位展平成序列，序列的长度即为小窗口的个数，将小窗口的高宽设置为M，因此序列长度为而序列个数即为小窗口的像素个数，即为M2个，对序列数据进行一次注意力计算，然后将序列数据重新折叠回原来的形状即步骤3.3将步骤3.2得到的数据和原始数据沿着维度方向进行拼接，拼接后形状为通过卷积层进行特征融合，融合之后的形状为步骤3.4将步骤3.3融合之后的数据再次下采样至重复步骤3.1-步骤3.3的操作，得到输出：其中X表示输出的图像数据；步骤4将步骤3中得到的数据线性展平成的形状，最后通过线性层得到输出结果：p＝B,N其中p表示模型预测类别的概率，N输出类别个数；步骤5对每一个批量中的预测数据，通过l∞范数，可以对注意力权重进行正则化，并且可以通过超参η控制其分布的稀疏程度其中loss表示模型训练的损失函数，N表示预测类别的个数，max|w|表示注意力层中的权重矩阵中最大值，W-MSA-weights表示步骤3.1中注意力计算的权重矩阵，IW-MSA-weights表示步骤3.2中注意力计算的权重矩阵，yi为独热编码的真实标签，pi表示模型预测概率；步骤5设置学习率和迭代次数，在数据集上训练得到训练过后的模型；步骤6将预测图片输入到模型中，同时将批量数B设置为1，将输出结果p＝1,N在第二维度按从大到小排序得到预测最大的类别即为图像类别。

全文数据：

权利要求：

百度查询：武汉科技大学一种基于稀疏注意力InterWindow块的Light Swin图像分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种页面构建方法和系统

下一篇：一种多能源能量调度系统及调度控制方法

相关技术

一种页面构建方法和系统

一种多能源能量调度系统及调度控制方法

一种变电站无人机巡视路径规划方法及系统

通信方法、装置、存储介质及程序产品

恒湿机

一种基于突变适配体的快速检测食品中残留甲硝唑的方法

一种盾构壁后注浆浆液及其制备方法

用于机动车的前照灯

一种超声波诊断检查防护装置

天然气发动机配气相位控制方法和天然气发动机

一种观赏树木运输种植装置及运输车

一种用于温控器的远程控制方法及系统

Light相关技术

一种基于稀疏注意力InterWindow块的Light Swin图像分类方法_武汉科技大学_202410560817.8

基于TIGIT和LIGHT的嵌合蛋白_沙塔克实验室有限公司_201880013956.1

用于NR-LIGHT系统的唤醒信号传输_联想(北京)有限公司_201980099973.6

一种基于Light GBM的汽轮发电机定子端部绕组频响函数预测方法_重庆邮电大学_202410246074.7

涉及过量游离LIGHT的方法和治疗_阿瓦洛治疗公司_202180025379.X

一种基于贝叶斯超参数优化的Light GBM回归的精煤灰分在线预测方法_四川川煤华荣能源有限责任公司_202410352336.8

一种基于Light GBM模型的塑料分类方法_上海如海光电科技有限公司_202410148979.0

用抗LIGHT抗体治疗溃疡性结肠炎的方法_阿瓦洛治疗公司_202280062064.7

一种复杂视觉页面light和dark模式一键切换方法_天翼云科技有限公司_202311712805.4

LIGHT蛋白作为采用细胞毒性法检测IFN-γ生物活性的辅助试剂的应用_翌圣生物科技(上海)股份有限公司_202310888357.7

Swin相关技术

一种基于Swin Transformer和CNN双分支耦合的图像配准方法_南京理工大学_202210650873.1

一种基于Swin-Transformer的突然电离层骚扰事件预报方法_中国电波传播研究所(中国电子科技集团公司第二十二研究所)_202410740195.7

一种基于改进注意力的Water-Res-Swin遥感图像水体分割方法_淮阴工学院_202410776988.4

一种基于改进Swin Transformer的生成对抗网络水下图像增强模型_江苏海洋大学_202410657609.X

基于多方向频带的Swin Transformer的图像分类方法_西安理工大学_202410635993.3

一种基于改进Swin Transformer的砂岩显微图像分类方法及系统_东北石油大学_202410562542.1

一种基于Swin Transformer的东巴文检测方法_西南大学_202410505468.X

一种耦合双三次插值法和Swin Transformer的GOSAT XCO₂数据重建方法_长江三峡技术经济发展有限公司_202410395176.5

一种基于改进Swin Transformer的车标识别方法_上海昊启信息科技有限公司_202410368518.4

基于改进Swin-T的智能风力发电轴承故障诊断方法_东北石油大学_202410619030.4

图像相关技术

图像读取装置和图像形成装置_京瓷办公信息系统株式会社_202280006190.0

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410846234.1

图像解码装置、图像解码方法及程序_KDDI株式会社_202080057643.3

光学设备、图像读取设备和图像形成装置_富士胶片商业创新有限公司_201910842509.3

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410845655.2

图像处理系统及图像处理方法_北方集成电路技术创新中心(北京)有限公司_202410659049.1

图像处理装置、图像处理方法以及记录介质_柯尼卡美能达株式会社_202410124768.3

具有图像传感器的图像处理系统_桂林康基大数据智能研究院_202410720555.7

光学膜、图像显示面板以及图像显示装置_大日本印刷株式会社_202410847055.X

图像形成装置及图像形成装置用单元_富士胶片商业创新有限公司_202311040536.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于稀疏注意力InterWindow块的Light Swin图像分类方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务