厦门大学张玉康获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利基于图像-属性和频域-空间域双重协同学习的行人属性识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540999B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411646026.3,技术领域涉及:G06V40/10;该发明授权基于图像-属性和频域-空间域双重协同学习的行人属性识别方法是由张玉康;卢杨;杨钰骏;王菡子设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本基于图像-属性和频域-空间域双重协同学习的行人属性识别方法在说明书摘要公布了:基于图像‑属性和频域‑空间域双重协同学习的行人属性识别方法,涉及计算机视觉技术领域。提出一个图像‑属性协同学习框架,集成视觉信息和属性标签,以感知对行人属性更精细的语义理解;通过可学习的属性提示获取属性向量表示,将行人图像输入图像编码器以获得视觉向量表示,将属性向量表示和视觉向量表示映射联合图像‑属性协同空间中,通过对比学习损失学习图像和属性之间的语义关联。提出一个频域‑空间域协同学习模块,利用涉及频域幅度谱分量和相位谱分量的交叉注意机制进行交互式引导学习,与空间信息协同学习。全面探索和利用行人图像中的频率‑空间双域信息,获得更稳健的视觉特征。在提高行人属性识别任务性能方面具有显著优势。
本发明授权基于图像-属性和频域-空间域双重协同学习的行人属性识别方法在权利要求书中公布了:1.基于图像-属性和频域-空间域双重协同学习的行人属性识别方法,其特征在于包括以下步骤: 1提出一个图像-属性协同学习框架,该框架集成视觉信息和属性标签,以感知对行人属性更精细的语义理解;图像-属性协同学习框架通过一系列可学习的属性提示获取属性向量表示,将行人图像输入CLIP图像编码器以获得视觉向量表示Vs,并将属性向量表示和视觉向量表示都映射到联合图像-属性协同空间中,通过对比学习损失来学习图像和属性之间的语义关联; 2提出一个频域-空间域协同学习模块,用于全面探索和利用行人图像在频域和空间域的双域多样化信息,以实现鲁棒的特征提取和属性识别,获得更稳健的视觉特征;利用涉及频域幅度谱分量和相位谱分量的交叉注意机制进行交互式引导学习,与空间信息进行协同学习; 所述频域-空间域协同学习模块,具体如下: 对于CLIP的图像编码器输出的特征Vs,首先使用快速傅立叶变换FFT将其从空间域变换到频域,以获得幅度谱分量Va和相位谱分量Vp,用数学方式表达如下: 其中,RVs和IVs分别对应于快速傅里叶变换FFTVa的实部和虚部; 在频域中,幅度谱分量Va与行人的某些属性相关,包括服装纹理、面部特征;相位谱分量Vp帮助更准确地识别行人的属性,包括轮廓、姿势;考虑到幅度谱分量Va和相位谱分量Vp包含不同且多样的属性信息,通过对幅度谱分量Va和相位谱分量Vp进行交互学习来充分促进两个组件之间的相互学习;其中,交互操作通过使用交叉多头注意力MCA实现相互学习;具体而言,幅度谱分量Va被设置为Q和V1,相位谱分量Vp被设置为K和V2,则交互操作的数学表达式表示为: 其中,Conv1和Conv2表示两个1×1的卷积层;将通过上述交互改进后的特征,通过快速傅里叶逆变换将其变换回空间域,并与空间域特征相加到矩阵中,完成空间域和频率域的协同学习; 通过快速傅立叶逆变换IFFT将通过上述交互操作获得的幅度谱分量和相位谱分量变换到空间域中,得到改善后的特征Vf,以及与空间域特征Vs一起用于频域-空间域的协作学习,以充分利用属性的频域-空间域信息提高性能。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励