买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广州像素数据技术股份有限公司
摘要:本发明公开了一种基于对比与一致学习的无监督人体解析方法及装置,其中方法包括:将人体解析图像进行数据扩增,使每张图像生成两个视图;将两个视图分别输入到特征提取器,提取图像特征;将图像特征分别输入到部件对比模块和像素一致模块,其中,部件对比模块通过对比学习从部件中区分出相似部件,其将语义一致的部件拉近,语义不同的部件尽可能的远,像素一致模块对经过数据扩增得到的两个视图,鼓励同一位置像素的特征一致;通过K‑Means算法生成伪标签;将伪标签作为监督信号,训练上述网络;在测试过程中,通过网络预测出图像的解析结果。
主权项:1.一种基于对比与一致学习的无监督人体解析方法,其特征在于,包括以下步骤:步骤1:将包含人脸解析的图像数据进行数据扩增,其中,每一所述图像数据生成两个视图数据;步骤2:将两个所述视图数据输入到特征提取器提取各自的图像特征;步骤3:将所述图像特征分别依次输入到部件对比模块和像素一致模块,以区分相似部件和鼓励同一位置像素特征一致,同时,通过K-Means算法生成伪标签;步骤4:将所述伪标签作为监督信号来训练网络,在测试过程中,通过网络预测出图像的解析结果其中,在所述步骤1中,通过随机光度变换改变所述图像数据的浅层外观,从而生成一所述图像数据的两个视图数据,其中,生成过程表示为:x1=P1xx2=P2x;在所述步骤2中,提取所述图像特征的方法包括任何形式的全卷积神经网络;在所述步骤3中,所述部件对比模块包括一全局池化层和两全连接层,在所述部件对比模块内的处理过程具体包括:对于每个编码的查询部件g,有一组编码的键部件t0,t1,…,tn与之对应,其中,对于每个查询部件g,编码的键部件有一个正样本t+和N-1个负样本t-;编码的查询和键部件分别来自输入所述视图数据的不同视图数据,且每个查询和键部件编码一个人体部件;正样本t+编码不同视图数据的相同部件,负样本t-编码不同视图数据中的其他部件;从而利用对比损失使g的特征和正样本t+的特征更相似,同时和N-1个负样本t-尽可能的不相同,其中,区别过程表示为: 其中,Lr表示部件对比损失,τ表示一个温度超参数。
全文数据:
权利要求:
百度查询: 广州像素数据技术股份有限公司 基于对比与一致学习的无监督人体解析方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。