买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于稀疏编码和字典学习的人脸识别方法,包括以下步骤:S1,从摄像头和图像库获取彩色人脸图像,转换为灰度图像,进行增强、归一化处理和三维对齐;S2,从公开人脸图像数据库收集带标签的训练数据,通过层次聚类初始化字典,采用多层次字典学习机制优化字典;S3,利用学习到的字典,将灰度人脸图像表示为稀疏线性组合,采用正交匹配追踪算法生成稀疏特征向量,并与红外和可见光图像特征融合;S4,利用多模态特征向量和训练数据训练支持向量机分类器,通过优化核函数和并行计算提高实时性能;S5,对新图像进行稀疏编码和分类,输出识别结果;S6,构建自主校正机制,动态调整预处理、稀疏编码和分类参数。
主权项:1.一种基于稀疏编码和字典学习的人脸识别方法,其特征在于,包括如下步骤:S1、从实时摄像头和本地图像库中获取彩色人脸图像,将彩色人脸图像转换为灰度人脸图像,使用图像增强技术进行增强处理,对灰度人脸图像进行归一化处理,并基于三维人脸模型进行对齐,处理面部姿态变化;S2、从公开人脸图像数据库中收集带有标签的初始训练数据,通过层次聚类方法进行字典初始化,将初始训练数据分成若干聚类,每个聚类中心作为字典初始元素,采用多层次字典学习机制,通过稀疏编码和字典更新的交替迭代,不断优化字典;所述S2包括以下步骤:S21、从公开人脸图像数据库中收集带有标签的初始训练数据;S22、通过层次聚类方法进行字典初始化,将初始训练数据分成若干聚类,每个聚类中心作为字典初始元素;S23、引入多层次字典学习机制,将字典学习过程分为多个层次,逐层优化字典:S24、在字典更新过程中结合非负矩阵分解算法,对初始字典进行非负矩阵分解,得到基矩阵和系数矩阵,在每次迭代中,保持非负约束条件,更新基矩阵和系数矩阵: ; ;其中,和分别表示第次迭代的字典矩阵和稀疏系数矩阵,为学习率,表示字典矩阵的元素逐个取对数;S25、通过稀疏编码和字典更新的交替迭代,不断调整字典,直到字典和稀疏表示收敛,生成最终学习到的字典;所述S23包括以下步骤:S231、对初始训练数据进行层次聚类,分成若干子集,每个子集代表一个层次,通过聚类中心作为字典的初始元素;S232、在第一个层次,使用稀疏编码算法对每个训练样本进行编码,表示为字典的线性组合,优化稀疏系数向量;S233、对每个层次的字典进行更新,在稀疏编码和字典更新之间交替进行迭代,优化字典矩阵: ;其中,表示第层的字典矩阵,为学习率,表示范数;S234、引入多层次字典学习机制,将字典学习过程分为多个层次,逐层优化字典,在每个层次上,将上一个层次的输出作为当前层次的输入,继续进行稀疏编码和字典更新;S235、在每个层次引入自适应稀疏度调节机制,根据当前层次的特征复杂性和重建误差动态调整稀疏度控制参数: ;其中,为稀疏度调节的学习率,为稀疏度调节的正则化参数,和分别表示重建误差和稀疏度对稀疏度控制参数的偏导数;S236、在每个层次采用基于梯度的自适应字典更新策略,通过监测每次迭代的重建误差,动态调整字典更新步长和方向: ;其中,为字典更新的动态步长,为字典更新的正则化参数;S237、通过多层次字典学习和优化,在不同粒度上提取特征,逐层提升字典的表达能力和区分能力,最终生成学习完成的字典;S3、利用已学习到的字典,将待识别的灰度人脸图像表示为字典原子的稀疏线性组合,采用正交匹配追踪稀疏编码算法求解稀疏表示,并将稀疏编码得到的稀疏系数向量作为稀疏特征向量,将灰度人脸图像的稀疏特征向量与红外图像和彩色人脸图像的特征进行融合,生成多模态特征向量;S4、利用多模态特征向量和初始训练数据训练分类器,采用支持向量机,通过核函数优化设计新的核函数,并利用并行计算优化实时性能;S5、对新的待识别的灰度人脸图像进行稀疏编码,提取特征向量,使用训练好的分类器进行分类并输出识别结果;S6、在整个识别过程中,构建自主校正机制,基于实时识别结果和环境变化,动态调整预处理、稀疏编码和分类参数。
全文数据:
权利要求:
百度查询: 上海匠心互娱网络科技有限公司 一种基于稀疏编码和字典学习的人脸识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。