买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆大学
摘要:本发明涉及计算机视觉领域和人群计数技术领域,具体涉及一种基于混合监督多任务学习的域适应人群计数方法及存储介质,方法包括:S1、根据输入图像生成标签密度图、标签人数和标签颠倒判断值;S2、建模;S3、对训练集进行训练,并将三种输出与对应的监督标签进行混合监督,使用三种损失函数计算误差,通过误差反向传播更新网络参数直至得到最优模型;S4、对于新数据集,需要对模型进行微调,生成标签人数和标签颠倒判断值作为监督标签;S5、将三种输出与两种监督标签通过损失函数计算误差,得到微调最优模型;S6、将测试集输入到最优模型中得到估计人数。本发明解决了现有技术不同数据分布差异与目标场景人群标注量少带来的计数准确性差的问题。
主权项:1.基于混合监督多任务学习的域适应人群计数方法,其特征在于,包括以下步骤:S1:利用第一人群数据集的标注信息进行标签生成,其中包括标签密度图、标签人数和随机生成图像的颠倒图片的标签颠倒判断值,并对其中的训练集进行数据增强;S2:建模混合监督多任务学习网络;S3:初始化预训练模型及其它网络层参数;S4:输入训练图像,输出估计密度图、估计颠倒判断值和估计人数,并计算估计密度图和标签密度图的损失、估计颠倒判断值与标签颠倒判断值的损失和估计人数与标签人数的损失;S5:选择优化算法最小化损失,并进行误差反向传播更新网络参数;S6:每训练一次,就在第一人群数据集的测试集上通过评价指标验证模型计数性能;S7:迭代S4、S5至设定次数,保存结果并获取适用于第一人群数据集的最优模型;S8:利用第二人群数据集的标注信息进行标签生成,其中包括标签人数和随机生成图像的颠倒图片的标签颠倒判断值,并对其中的训练集进行数据增强;S9:载入适用于第一人群数据集的最优模型;S10:输入第二人群数据集的训练数据,输出估计密度图、估计人数与估计颠倒判断值,并计算估计密度图与估计人数所在分支产生的估计密度图的损失,计算颠倒判断值与标签值的损失和估计人数与真实人数的损失;S11:选择优化算法最小化损失,并进行误差反向传播更新网络参数;S12:每训练一次,就在第二人群数据集的测试集上通过评价指标验证模型计数性能;S13:迭代S10、S11至设定次数,保存结果并获取适用于第二人群数据集的最优模型;S14:将第二人群数据集的测试集图片输入S13的最优模型中,输出预测密度图并进行积分获得估计人数;所述步骤S2具体为:建模混合监督多任务学习网络,包括特征提取共享模块、颠倒图像判断辅助任务模块、估计密度图生成主任务模块和估计人数生成辅助任务模块,具体包括以下子步骤:S201、采用VGG16-BN模型的前10层作为特征提取共享模块,作为其余模块的共享层;S202、颠倒图像判断辅助任务模块具体为,步骤S201提取了512通道数特征X0经过了全局平均池化层进行降维,将特征图转化为得到二维数据,此后通过四层全连接层,神经元数量为512,128,64,2,前三层后接ReLU激活函数,最后通过Sigmoid激活层将二维数据映射到[0,1]的范围内,获得图像颠倒与不颠倒的估计颠倒判断值,采用颠倒判断值标签进行自监督学习;S203、估计人数生成辅助任务模块具体为,将S201提取的512通道数特征X0输入到5层普通卷积层中,包括4个核大小为3X3,通道数为512、256、128、64的带BN的卷积层,以及一个核大小为1×1通道数为1的卷积层,激活函数均为ReLU激活函数,最终得到估计密度图G1,并进行积分得到估计人数,采用计数级标签进行弱监督学习;S204、估计密度图生成主任务模块具体为,将S201提取的512通道数特征X0输入到5层普通卷积层中,包括4个核大小为3X3,通道数为512、256、128、64的带BN的卷积层,以及一个核大小为1×1通道数为1的卷积层,激活函数均为ReLU激活函数;最终得到估计密度图G2,采用位置级标签进行全监督学习,作为评价指标判断模型的计数性能。
全文数据:
权利要求:
百度查询: 重庆大学 基于混合监督多任务学习的域适应人群计数方法及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。