买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽工业大学
摘要:本发明公开了一种基于双模态数据增强的无监督跨模态行人检索方法,属于计算机视觉技术领域。本发明通过同时对可见光和红外图像进行色彩增强,拉近不同模态在特征空间的距离,提高跨模态对齐的准确度;然后采用自适应反事实推理将图拓扑结构的学习约束在较小的范围内,使模型更易于学习到更优的拓扑结构;通过上述两种操作,最终提升无监督跨模态行人检索的性能。
主权项:1.一种基于双模态数据增强的无监督跨模态行人检索方法,其特征在于,包括以下步骤:S1:对输入的可见光和红外图像进行预处理;S2:将可见光和红外图像转换到HSV颜色空间下,对红外图像注入服从正态分布的色度和饱和度信息,然后对两个模态的图像均进行色彩增强;S3:采用双流主干网络分别提取不同模态的特征,之后在特征空间中进行聚类得到伪标签;S4:对得到的不同模态伪标签采用二分图匹配策略进行跨模态匹配,生成可靠的跨模态对应关系;可见光图像和红外图像分别作为查询集进行匹配,并且交替使用对比学习损失Laccl来优化模型,即红外到可见光学习和可见光到红外学习,每轮交替进行;S5:引入反事实推理来引导模型学习,基于上述交叉对比学习损失Laccl和反事实推理交叉熵损失Ltie,构建综合损失函数;S6:基于综合损失函数,通过网络反向传播对双流主干网络的参数进行更新;S7:重复进行步骤S2-S6,直到模型达到预定的性能指标或者满足指定的终止条件。
全文数据:
权利要求:
百度查询: 安徽工业大学 一种基于双模态数据增强的无监督跨模态行人检索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。