浙江工业大学郑航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于注意力机制的单阶段多目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117252902B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311164979.1,技术领域涉及:G06T7/246;该发明授权一种基于注意力机制的单阶段多目标跟踪方法是由郑航;崔滢;潘翔;郭东岩;全玥芊设计研发完成,并于2023-09-08向国家知识产权局提交的专利申请。
本一种基于注意力机制的单阶段多目标跟踪方法在说明书摘要公布了:一种基于注意力机制的单阶段多目标跟踪方法,选择多目标跟踪数据集并进行图像的预处理;搭建网络模型,在骨干网络之后加入设计的辨别增强模块,在辨别增强模块之后加入检测分支的预测头和设计的身份保留模块,最后在身份保留模块之后加入re‑ID分支的预测头;训练时随机选择数据集视频中某帧的图片作为输入,将数据集标注中每一个行人的坐标作为检测分支的样本,每一个行人的id标识作为身分特征训练的样本;测试时将视频的当前帧作为输入,得到当前帧的检测结果和身份特征;匹配过程。本发明提高了具有尺度变化的对象匹配的适应性。
本发明授权一种基于注意力机制的单阶段多目标跟踪方法在权利要求书中公布了:1.一种基于注意力机制的单阶段多目标跟踪方法,其特征在于,所述方法包括以下步骤: 1选择多目标跟踪数据集并进行图像的预处理; 2搭建网络模型,在骨干网络之后加入设计的辨别增强模块,在辨别增强模块之后加入检测分支的预测头和设计的身份保留模块,最后在身份保留模块之后加入re-ID分支的预测头; 3训练时随机选择数据集视频中某帧的图片作为输入,将数据集标注中每一个行人的坐标作为检测分支的样本,每一个行人的id标识作为身分特征训练的样本; 4测试时将视频的当前帧作为输入,经过特征提取之后首先通过辨别增强模块得到增强后的特征,再将增强后的特征分别输入金检测的预测头和身份保留模块,最后得到当前帧的检测结果和身份特征; 5匹配过程分三步,第一步,将当前帧和前一帧连接,对新检测目标进行外观和距离的匹配;第二步,再次将当前帧和前一帧连接,计算上一步没有匹配成功的IOU距离;第三步,更新状态,用于下一帧的匹配; 所述步骤2中,网络模型的框架可以看成有三部分组成,分别是特征提取骨干网络,用于提取当前帧图片的特征;辨别增强模块,用于对当前帧对象的辨别特征进行增强,它有一个空间注意增强和一个通道注意增强组成;身份保留模块,它由通道注意力组成,用于重新校准通道,以实现针对特定对象的信息,并保留身份特征的语义对齐; 采用ResNet-34作为骨干,将增强版的深层聚合DLA应用于主干,以融合多层特征,输入的图像大小表示为608×1088×3,提取到的特征大小152×272×3,首先将特征输入进辨别增强模块,该模块由一个空间注意增强和一个通道注意增强组成,通过自注意力机制实现空间注意增强,对具有局部特征的远程空间信息和背景信息进行编码,自注意机制过程由如下公式来展现: 首先是空间注意增强,F∈RC×H×W表示骨干网络提取到的特征,F通过三个学习权重矩阵得到Q,K,V∈RC×H×W,再由计算得到空间注意力图其中N=H×W,它表示第i个位置对第j个位置的特征影响,这两个位置的相关性与的值呈正相关;然后的转置和F计算得到一个新的特征图,然后调整维度为RC×H×W,得到最终的输出FSA∈RN×N,它是由一个可学习的参数α乘以特征F运算得到: 其中在FSA的每个位置,最终的特征是具有最初提取到的特征所有位置的加权和计算得到的;因此,增强后的特征可以自适应地从空间注意图中获得一个全局的上下文视图和聚合,从而提高了对象类内的一致性; 接下来经过通道注意增强部分,首先将主干网络提取到的特征F∈RC×H×W重塑为RC×N,其中为N=H×W,同样经过三个可学习的权重矩阵学习得到Q,K,V∈RC×H×W,然后K的转置和Q计算经过一个softmax层获得通道注意力图它表示第i个通道对第j个通道在特征上的影响;接下来,对的转置矩阵和F进行乘法运算,并将结果的维度调整为为RC×H×W;最后乘以一个可学习的参数β,并以元素级的方式与特征图F求和,得到最终的输出FCA∈RC×H×W: 其中对于FCA的每个通道,它是所有通道上的特征和原始特征的加权和,可以提高远程上下文信息对特征的可辨别性; 最后,将两部分增强的特征进行融合,作为辨别增强模块的最终输出,用于预测检测结果,输入的特征又被送入身份保留模块;首先,将辨别特征模块输出的FDEM∈RC×H×W特征划分为每个通道上不同内核大小的多尺度特征;接下来,利用SEWeight模块进一步提取多个尺度的输入特征映射的通道注意,生成通道级注意权向量,表示为: 其中Zi∈RC′×1×1是注意力权重,每个特征图具有不同尺度的特征图,具有共同通道维度C’=CS,通过该操作,可以更加关注适合re-ID任务的浅层特性,通过将权重与相应尺度中的特征相乘,通过局部和全局通道之间更好的信息交互来获得增强的特征: 最后,将它们融合起来,为预测身份特征生成细化的特征图: FIPM=Cat[Y0,Y1,...,YS-1] 该身份保留模块保留了身份特征的语义对齐,它是对辨别增强模块的补充,提高了关联过程中不同尺度对象的弹性,从而改善了具有不同尺度变化能力的对象匹配的自适应性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区朝晖六区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励