重庆邮电大学唐贤伦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于区域扩增和位置信息交互的视频行人重识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116758632B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310704051.1,技术领域涉及:G06V40/20;该发明授权一种基于区域扩增和位置信息交互的视频行人重识别方法是由唐贤伦;陆斌宇;邓武权;王乐君;钱小东;万辉;黄健;李伟生;徐梓辉;陈霸东设计研发完成,并于2023-06-14向国家知识产权局提交的专利申请。
本一种基于区域扩增和位置信息交互的视频行人重识别方法在说明书摘要公布了:本发明请求保护一种基于区域扩增和位置信息交互的视频行人重识别方法,属于图像检索方法。包括以下步骤:数据切片及预处理;然后使用通道注意模块进行通道权值重建;接着提取前帧的显著特征,进一步将后帧的关注区域从显著到全面进行过渡;然后利用位置信息交互LII模块促进位置信息跨所有帧交互,以实现帧之间的相互增强;最后根据模型设计损失函数并进行训练,值得注意的是,在测试阶段,去除LII模块以提升推理速度。本发明提出了轻量化的视频行人重识别模型,在多个公共基准上展现了强大的性能和泛化能力。
本发明授权一种基于区域扩增和位置信息交互的视频行人重识别方法在权利要求书中公布了:1.一种基于区域扩增和位置信息交互的视频行人重识别方法,其特征在于,包括以下步骤: 步骤1:对输入视频基准数据进行切片,然后对输入视频帧进行包括裁剪、随机擦除、归一化、水平或垂直翻转以及随机填充在内的预处理操作; 步骤2:对于原始输入特征利用通道注意层CAL进行处理,用于进行通道权值重建,过滤错误以及无意义的通道; 步骤3:在经过CAL之后,提取前帧的显著特征,其中P为经过CAL处理后的0到s的特征映射集合,s为步骤1中切片位置,提取的特征将用于抑制后续帧级特征的显著信息; 步骤4:利用生成的特征来抑制中已经在P中激活的显著区域,其中Q为经过CAL处理后的s到t-1的特征映射集合,t为输入帧总数,使得其后的帧级特征关注更加宽泛的细粒度信息,获得更完整的特征表示; 步骤5:将信息从传递到其中X为初始输入张量,Y为最终生成的特征抑制图; 步骤6:集成和分发帧信息的全局特性,建立时空维度任意两个位置之间的连接,使信息能够跨所有帧传递的同时实现帧之间的相互增强; 步骤7:根据模型设定设计损失函数来指导训练过程; 步骤8:在训练阶段,通过步骤1-7的操作实现特征间的信息交互以及从显著到全面的过渡,来辅助骨干ResNet-50训练,在测试阶段,放弃部分分支以提升推算速率,保证模型轻量化,最后计算mAP和Rank以评估模型性能; 所述步骤1具体为: 从显著到全面过渡SFT框架的输入有两项,分别为特征映射以及分割位置;对于特征映射,SFT采用了具有详细语义信息的中层特征映射;给定一个切片包含t帧,利用骨干的Res-Net50网络获得中间层特征映射这里的c代表通道数,h代表高度,w代表宽度; 对于分割位置s,它决定了前帧和后帧中哪些帧需要被抑制,即SFT会捕捉X0,…,s-1中的显著特征,抑制后帧Xs,…,t-1中的显著特征; 然后对输入视频帧进行包括裁剪、随机擦除、归一化、水平或垂直翻转以及随机填充在内的预处理操作,其中随机填充是新提出的数据增强方法;具体而言,原始图像尺寸为C×W×H,生成的噪声图像的尺寸为C×d×W×d×H,其中d是在1,1+r范围内生成的一个随机数,r代表常数,然后将原始图像叠加到噪声图像的随机位置,最后使用Resize操作缩小至原始图像大小作为输入; 所述步骤7具体为: 采用交叉熵损失Lcent和三元组损失Ltri来共同指导训练过程;此外,为了保持帧之间的多样性,利用互信息损失Lmi来最小化不同帧的嵌入的相互信息;具体表达式如下: Lall=Lcent+λ1Ltri+λ2Lmi。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励