买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆邮电大学
摘要:本发明属于行人重识别领域,涉及基于双流Transformer框架的图像文本行人重识别方法。该方法包括以下步骤:S1对数据集进行预处理包括图像数据增强以及文本随机掩码;S2对预处理后图像文本数据分别输入到双流Transformer网络中进行特征提取;S3对于掩码文本特征向量,与图像向量间进行跨模态交互编码;S4对于未掩码的文本特征向量,将其与图像向量进行特征共享学习;S5对上述步骤训练的模型,在测试数据集上进行实验,得到最终结果。本发明提出一种结合双流Transformer模型,充分提取文本辅助信息和图像信息的全局特征和细粒度特征,然后融合文本信息和图像信息分别进行注意力的交互以及特征共享学习,最后通过合适的损失函数的计算,从而实现高性能的行人重识别方法。
主权项:1.基于双流Transformer框架的图像文本行人重识别方法及系统,其特征在于:该方法包括以下步骤:S1对数据集进行预处理包括图像数据增强以及文本随机掩码;S2对预处理后图像文本数据分别输入到双流Transformer网络中进行特征提取;S3对于掩码文本特征向量,与图像向量间进行跨模态交互编码;S4对于未掩码的文本特征向量,将其与图像向量进行特征共享学习;S5对训练好的模型,在测试数据集上进行实验,得到最终结果。
全文数据:
权利要求:
百度查询: 重庆邮电大学 基于双流Transformer框架的图像文本行人重识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。