恭喜国网智慧能源交通技术创新中心(苏州)有限公司;国网电动汽车服务有限公司;国网湖南电动汽车服务有限公司;北京佰汇亿达科技有限公司;湖北经济学院耿学文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜国网智慧能源交通技术创新中心(苏州)有限公司;国网电动汽车服务有限公司;国网湖南电动汽车服务有限公司;北京佰汇亿达科技有限公司;湖北经济学院申请的专利一种融合ViT的跨模态行人重识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114898397B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210360028.0,技术领域涉及:G06V40/10;该发明授权一种融合ViT的跨模态行人重识别方法及装置是由耿学文;朱盛开;刘文平;葛慧;李明磊;朱卫东;肖建平;范学志;董磊;朱晓波;方向亮;周杰设计研发完成,并于2022-04-07向国家知识产权局提交的专利申请。
本一种融合ViT的跨模态行人重识别方法及装置在说明书摘要公布了:本发明提供了一种基于深度学习模型的跨膜态行人重识别方法及装置,属于人工智能图像处理领域,方法的主要步骤为:对行人的可见光图像和红外图像使用数据增强技术以增加图像数据的多样性;使用ResNet50网络和ViT模块融合设计一种混合双通路深度学习网络模型,可以用来提取可见光和红外两种模态图像的特征;该模型的损失函数使用分类损失函数和改进的三元损失函数的组合,并且这两个损失函数的权重随训练过程中损失函数的值的改变而改变,从而能够平衡两个损失函数在模型训练过程中的重要度;在使用过程中,使用该模型提取不同模态图像的特征,并以此判断不同图像是否表示为同一个行人。
本发明授权一种融合ViT的跨模态行人重识别方法及装置在权利要求书中公布了:1.一种融合ViT的跨模态行人重识别方法,其特征在于:获取行人的可见光和或红外图像,根据行人的可见光和或红外图像,在可见光和或红外图像数据库中查询出相同的人;所述融合ViT的跨模态行人重识别方法,具体包括以下步骤:S1:获取行人的可见光图像和或红外图像,进行标注,并构建模型的训练集;S2:对经S1标注后的可见光图像和或红外图像进行数据增强;S3:融合ResNet50网络和ViT构成深度学习网络ResNet-ViT,并使用ID分类损失函数和改进的三元损失函数的组合作为所述深度学习网络ResNet-ViT的损失函数;S4:将经过S2数据增强后的可见光图像和或红外图像输入S3中所描述的深度学习网络ResNet-ViT中,提取可见光图像和或红外图像的特征,并进行训练;S5:在实际使用过程中,通过计算经过S4获取的可见光图像和或红外图像与待查询图像的距离来判断他们是否为同一个行人;S3中所述深度学习网络ResNet-ViT的具体结构如下:所述深度学习网络ResNet-ViT是一种混合双通路深度学习网络架构,它的主干网络由ResNet50网络和ViT模块融合构成;所述深度学习网络ResNet-ViT图像处理过程具体如下:行人的可见光图像V和红外图像I分别放入block0-x,residualblock1-x和residualblock2-x中提取浅层特征和各模态的固有特征,然后输入具有共享参数的residualblock3和residualblock4残差块中提取高层特征以及不同模型的不同模态的共有特征;所述深度学习网络ResNet-ViT使用ResNet50网络提取行人图像特征的同时,在卷积层块和每个残差块的输出分别使用ViT模块提取信息,然后串联起来,最终和ResNet50网络提取的特征合并在一起构成行人图像的特征F,所述F为一个一维向量;F再经过一个批处理层输入到分类层。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网智慧能源交通技术创新中心(苏州)有限公司;国网电动汽车服务有限公司;国网湖南电动汽车服务有限公司;北京佰汇亿达科技有限公司;湖北经济学院,其通讯地址为:215000 江苏省苏州市苏州高新区科技城科灵路78号6号楼201;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。