一种异构双分支投票半监督图像分割方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学

摘要：本发明属于图像处理方法技术领域，公开了一种异构双分支投票半监督图像分割方法，旨在通过结合卷积神经网络和注意力机制的网络，来提高半监督语义分割任务中伪标签的质量和模型的精度。该方法特别适用于处理大规模、少标记或无标记的图像数据集。本发明通过异构网络结构生成伪标签，利用特征交流分支和动态投票机制增强模型的预测能力，从而减少确认偏差问题并提供更精确的分割结果。该方法包括数据预处理、伪标签生成和模型训练三大步骤，通过实验验证表明，所提方法在多个标准数据集上的表现优于现有技术，特别是在处理复杂场景和细粒度对象时表现出更高的鲁棒性和准确性。

主权项：1.一种异构双分支投票半监督图像分割方法，其特征在于，包括如下步骤：步骤1：数据预处理（1）数据集选择与裁剪：使用增强版PascalVOC2012数据集和Cityscapes数据集；增强版PascalVOC2012数据集由经典PascalVOC2012数据集和语义边界数据集组成；其中经典PascalVOC2012数据集包括高质量人工标注的训练图像和验证图像，语义边界数据集包含粗糙人工标注的图像；对增强版PascalVOC2012数据集中的图像进行裁剪至513×513分辨率，对Cityscapes数据集中的图像裁剪至801×801分辨率；（2）数据集划分：首先根据半监督语义分割的经典协议和混合协议分别对增强版PascalVOC2012数据集中的训练集进行划分，划分方式如下：1）使用经典协议划分：从经典PascalVOC2012数据集训练集的高质量人工标注的训练图像中挑选数据并划分为有标注训练子集，剩余数据划分为无标注训练子集；具体为：分别将包含高质量人工标注的训练集总图像数的116、18、14、12作为有标注训练子集，其余作为无标注训练子集；2）使用混合协议划分：从增强版PascalVOC2012的全部训练集中挑选数据并划分为有标注训练子集，其余数据作为无标注训练子集；具体为：分别将全部训练集总图像数的116、18、14的图像作为有人工标注训练子集，其余作为无标注训练子集；将Cityscapes数据集中的训练集总图像数的116、18、14、12的图像作为有标注训练子集，其余作为无标注训练子集；（3）数据增强：对数据集中的所有输入图像均使用两种数据增强方式，包括弱增强和强增强；弱增强是对两个数据集中训练集的输入图像使用随机裁剪和翻转；强增强是在弱增强的基础上通过CutMix方法对同一批次的不同图像进行拼接；首先对输入的一个批次的图像应用弱增强，将弱增强后的图像通过异构网络来生成伪标签，而后再对同一批次的图像使用强增强，将强增强后的图像输入网络进行监督预测；步骤2：伪标签的构建（1）构建异构网络：异构网络包括两个并行的第一网络和第二网络，第一网络使用DeepLabV3+结构，其编码器采用ResNet结构，为ResNet-50或ResNet-101，解码器使用二维卷积与上采样层结合；第二网络采用带有注意力机制的SegFormer网络；第一网络和第二网络作为各自的原始分支，在原始分支的编码器和解码器之间均增加交流分支，原始分支负责处理经过数据增强后的图像并产生分割结果，交流分支负责利用特征通信模块融合两个并行的网络的另一网络的编码器提取出的图像特征；在第一网络和第二网络的解码器后引入投票模块，其通过对第一网络和第二网络解码器的输出进行置信度预测并按规则产生伪标签；特征通信模块的实现过程：首先通过线性插值和卷积操作处理来自两个并行的网络的另一网络编码器提取出的图像特征，并引入0.5的dropout概率以增强图像特征的多样性；之后将处理后的图像特征与本网络编码器提取出的图像特征进行加权融合以优化图像特征的互补信息，其具体过程由如下公式来表示：其中，表示第张图像，表示输入的图像特征，表示网络标识，表示融合后的图像特征，是可调节的比例系数，在第一网络中为0.01，在第二网络中为0.1，表示线性插值和卷积操作，表示求取余数；（2）网络预测与伪标签优化：建立异构网络后，将弱增强处理后的图像分别通过第一网络和第二网络进行预测，再将预测结果送入投票模块中；投票模块对预测结果使用torch的max函数来确定每个像素的类别并预测置信度；再使用Softmax对预测置信度进行归一化；伪标签根据归一化后的各像素的置信度和生成的随机数按规则产生，其具体过程如下：首先将两个数据集中的经过弱数据增强处理后的无标注训练子集中的图像送入异构网络的原始分支上进行预测，得到第一网络和第二网络上的预测结果和；将这两个预测结果送入投票模块中，投票模块对预测结果使用torch.max函数来确定每个像素的类别并预测置信度：其中，和分别表示模型的预测结果以及相应的类别标签，表示第张图像，表示第个像素位置；对于预测结果中的每个像素位置，第一网络和第二网络的输出先通过Softmax函数进行处理，计算出每个网络对应的概率结果和，随后利用torch.rand函数生成的0到1之间的随机数来决定像素类别标签，通过对归一化概率和随机数的大小的比较决定采用第一网络或第二网络的预测结果，这个过程的公式表达如下：其中，和分别表示模型的第一网路和第二网络预测概率最大的类别的概率，和为第一网络和第二网络最大概率预测对应的类别，表示最终的伪标签，C表示总体类别数量；步骤3：模型训练1无标注图像训练：对两个数据集进行训练时，异构网络将训练集中的无标注训练子集中的图像送入两个网络中，每个网络首先通过编码器提取图像特征得到对应的特征图，随后每个网络通过交流分支和原分支分别对编码器生成的特征图进行预测，两个网络分别得到两个预测结果，最终共得到四个预测结果；而后利用步骤2生成的伪标签与四个预测结果进行交叉熵损失的计算：其中，表示无标注图像的集合，表示交叉熵损失，和分别表示原分支和特征交流分支上的预测结果，H和W表示特征图的长度和宽度，表示无标注损失；2有标注图像训练：该过程和无标注图像训练相同，得到四个预测结果，但使用图像的真实标注而不是伪标签来进行预测结果的计算：其中，表示有标注图像的集合，表示有标注图像标签，表示有标注损失；3损失计算与优化：计算有标注图像和无标注图像的损失，有标注图像产生的预测结果受真实标注标签监督并计算交叉熵损失，无标注图像产生的预测结果受步骤2产生的伪标签监督，并计算交叉熵损失；通过将有标注图像损失和无标注图像损失进行加权得到总损失，并进行模型的反向传播和优化，其中损失比例权重由参数控制；具体公式如下：其中，为控制损失的比例系数。

全文数据：

权利要求：

百度查询：大连理工大学一种异构双分支投票半监督图像分割方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种分布式光伏系统并网控制方法及系统

下一篇：一种铜光催化未活化卤代烃胺化制备氮烷基化化合物的方法

相关技术

一种分布式光伏系统并网控制方法及系统

一种铜光催化未活化卤代烃胺化制备氮烷基化化合物的方法

一种生态水循环三角集成装置

背光模组及显示装置

一种可降解咖啡渣复合材料及其制备方法与制品

一种音视频混合数字多码加密方法

一种热电芯片的制作方法

一种蓝牙耳机及蓝牙耳机装置

一种新型胶囊咖啡机酿造腔体

一种公路深层病害双组分高聚物抽拔注浆加固装置及方法

一种装饰条连接件与立柱压板的连接工艺

一种建筑工程结构缝隙灌浆装置

图像相关技术

图像处理电路、包括该图像处理电路的图像信号处理器以及图像处理方法_三星电子株式会社_202410329549.9

图像缓存系统、图像缓存方法、图像缓存架构及车辆_比亚迪股份有限公司_202411187871.9

图像传感设备、计算装置、图像处理设备和图像重构方法_清华大学_201810439116.3

图像编码设备、图像解码设备及发送图像数据的设备_LG电子株式会社_202411023707.4

图像处理装置、图像处理方法和图像处理系统_索尼集团公司_201980080325.6

图像处理系统、记录介质及图像处理方法_富士胶片商业创新有限公司_202310922380.3

图像处理系统、记录介质及图像处理方法_富士胶片商业创新有限公司_202311036227.7

X光图像与CT图像的配准方法_威海威高骨科手术机器人有限公司_202110131329.1

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

图像生成系统、图像生成方法和程序_松下知识产权经营株式会社_202380022120.9

投票相关技术

基于邻域拓扑与投票机制的关键节点识别方法的验证方法_重庆理工大学_202410093254.6

基于邻域拓扑与投票机制的复杂网络关键节点识别方法_重庆理工大学_202410093257.X

计算机实现的投票过程和系统_区块链控股有限公司_201980016404.0

一种用于电子投票的聚合签名方法_南京信息工程大学_202111432958.4

直播投票方法及装置_上海哔哩哔哩科技有限公司_202410890270.8

一种防投票卡住的城乡规划用方案投票装置_河北康莱建筑工程有限公司_202420272379.0

一种基于张量投票的工业零件检测方法及系统_南京邮电大学_202410844910.1

抗共谋攻击电子投票方法、系统、存储介质和终端设备_湖南天河国云科技有限公司_202410939265.1

基于投票的签名服务方法、装置、电子设备及存储介质_平安普惠企业管理有限公司_202210588735.5

一种能自动按序整理选票的投票箱_北京市朝阳区实验小学_202323564056.3

监督相关技术

基于边界框回归的弱监督目标检测方法_西安电子科技大学_202210398499.0

基于因果推理的半监督图像分类方法_西安电子科技大学_202210896650.3

一种无监督多视图数据的特征提取与聚类方法_贵州大学_202411007559.7

使用神经网络进行弱监督的对象检测方法及系统_辉达公司_202010524624.9

病理玻片数字图像数据集的半监督甄选方法和甄选系统_赛维森(广州)医疗科技服务有限公司_202210228192.6

基于监督学习的住宅户型布局生成方法及系统_清华大学_202111656595.2

卫星遥感影像地表水体无监督提取方法和装置_生态环境部卫星环境应用中心_202410588977.3

一种基于自监督增强用户偏好的多模态推荐方法及设备_湖北大学_202411195558.X

基于约束投影的无监督波束赋形优化方法、装置及设备_西安电子科技大学_202410709613.6

基于判别特征学习和熵的深度半监督图像分类方法_西安理工大学_202210446055.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种异构双分支投票半监督图像分割方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务