一种基于条件化早退机制的动态推理路径目标跟踪方法

导航：龙图腾网> 最新专利技术> 一种基于条件化早退机制的动态推理路径目标跟踪方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学;大连理工大学宁波研究院;大连维视科技有限公司

摘要：本发明属于机器学习、视觉目标跟踪领域，提供了一种基于条件化早退机制的动态推理路径目标跟踪方法。本发明的目标跟踪器使用MAE预训练的ViT结构作为特征提取主干，同时在不同的编码器层设置多个早退决策点，用于动态路径推理，在保证跟踪结果高准确性的同时，为不同的视频帧动态选择不同的推理路径，大大节省了在简单样本帧上推理的计算量，提高了跟踪方法的实际速度。另外，本发明可以部署在不同算力的设备上，只需要训练一次，之后的实际部署可以根据场景边缘设备的算力等条件灵活设置决策边界以满足实际应用中对算法性能和速度的权衡。

主权项：1.一种基于条件化早退机制的动态推理路径目标跟踪方法，其特征在于，步骤如下：步骤1：借助成像设备获得需要处理的连续视频流；步骤2：输入连续视频流，同时在视频初始帧中指定待跟踪的初始目标；用向量B0表示初始目标所在的位置和大小：其中，是初始目标中心点所在的位置，h0,w0是初始目标的尺度；步骤3：根据指定的待跟踪的初始目标，生成模板区域，模板区域是初始目标边界框的一个向外扩展区域，其中心位置不变，尺度为γtem倍的初始目标尺度h0,w0的几何平均数；同时，以给定的初始目标为根据，生成待跟踪帧的搜索区域；根据目标运动轨迹的连续性，搜索区域的中心位置与上一帧的目标中心位置一致；若上一帧是初始帧，中心位置即为初始帧指定的目标中心位置；搜索区域的尺度为γsea倍的上一帧目标尺度的几何平均数；步骤4：通过transformer的编码器层提取模板区域和搜索区域的深度特征；Transformer的编码器层取自ViT模型，单个transfomer编码层主要由多头注意力模块、层归一化、前馈网络和残差连接组成；多头注意力模块接收维度为768的token输入，先计算出是三个新的矩阵：Query、Key、Value；三个新的矩阵是用输入token与一个随机初始化的矩阵相乘得到的；Query矩阵和Key矩阵相乘，乘以一个缩放常数，再做softmax操作，最后乘以Value矩阵得到自注意力结果；多头注意力机制对上述求自注意力的过程拆分为12次，之后将所有的自注意力结果拼接起来作为多头注意力模块的输出；前馈网络主要由一个全连接层、GELU激活函数、Dropout层、全连接层和Dropout层依次连接组成；Transformer的编码器层提取模板区域和搜索区域特征包括以下步骤：4.1输入端处理：将模板区域和搜索区域的图像块进行变换，使图像尺寸与网络输入尺寸一致；4.2图像块经过Embedding层，生成token序列；Embedding层采用768个卷积核的卷积层，大小为16×16，步长为16；之后在生成的模板区域和搜索区域和上加入相应的位置编码，并将模板区域和搜索区域token拼接起来： 4.3拼接的模板区域和搜索区域特征H0经过N次堆叠的transformer编码器层生成深度特征HN；步骤5：编码后的深度特征HN在向后传播的过程中会经过路径决策节点，每个决策节点Ei都将对当前目标鉴别状态进行判断；动态路径推理过程具体包含以下步骤：5.1将步骤4.3中堆叠的transformer编码器层作为主干网络，在主干网络中提取的编码特征当遇到决策点时进入适应层，适应层由transformer编码层组成，其初始化参数加载自步骤4.3中主干网络中对应的网络层，具体的，第一组适应层参数加载自主干网络的第3-4层参数，第二组适应层参数加载自主干网络的第7层参数；第一个决策点的适应层为2层，第二个决策节点的适应层为1层，第三个决策点适应层数为0层；5.2编码特征经过层归一化，并送入一个瓶颈模块将其维度从768维映射到256维；5.3此时，编码特征被送入IoU预测模块即IoU得分预测头进行当前节点IoU得分预测，预测所得到的IoU得分将作为是否选择早退的判断条件；IoU得分预测头由一个3层的MLP构成，第一层将256维输入映射到512维，中间层维持512维不变，第三层将512维特征序列映射到1维的IoU得分；步骤6：决策条件判断；通过IoU得分值的高低，判断是否符合模型早退条件；根据实际部署平台的算力情况、实例应用场景对算法速度的需求，设置不同的IoU阈值τ；如符合早退条件，则编码特征将从当前决策节点经过IoU得分预测头之后退出，即完成当前帧的目标跟踪过程；而被判断为尚未符合早退条件的情况，则编码特征将继续向后传播，直至传播到主干网络的最后一层，期间前面的决策点编码特征将复用到后面节点；条件化早退机制的决策过程如下：6.1在步骤5.3中所得到的IoU评分score与动态网络设置IoU阈值τ进行对比，如score≥τ则满足早退条件，编码特征将直接进入角点预测头，对目标所在位置的左上和右下角点进行预测，最终输出当前帧的目标位置和尺度：角点预测头由4个RepVGG块和一层3×3的卷积层组成，特征维度从256维依次映射到128、64、32、16、2层，最后的两层特征图分别代表左上和右下角点的预测图，将角点预测图的最高响应处作为目标预测的左上和右下角点，并生成最终的预测目标边界框；6.2在步骤5.3中所得到的IoU评分score与动态网络设置阈值τ进行对比，如scoreτ则不符合早退条件；决策点处的编码特征将继续从主干网络向后传播，直到遇到下一个决策点；在步骤5.2中生成的编码特征将在后续的决策网络中被复用，复用方式为直接相加到此处的特征编码上；之后再经过步骤5.2步骤5.3中的环节；步骤7：依次经过每个早退决策点，如满足早退条件，则预测当前帧目标所在位置和尺度，结束该帧预测，如不符合条件，则继续向后传播，经过后续决策节点，得到最终的当前帧预测结果；对输入的视频帧依次预测，获得对应视频序列的所有帧目标跟踪结果。

全文数据：

权利要求：

百度查询：大连理工大学大连理工大学宁波研究院大连维视科技有限公司一种基于条件化早退机制的动态推理路径目标跟踪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种储物筐可调节的电动购物车

下一篇：一种预制菜保鲜运输箱

相关技术

一种储物筐可调节的电动购物车

一种预制菜保鲜运输箱

一种新型高防潮纤维板

一种双推杆固定可调式光伏支架

一种具有防护结构的物料升降装置

液体加热器具

一种具有防护功能的建筑结构加固连接装置

一种新型动盖板

全塑壳防静电吹尘枪

一种中压开关柜的保护装置及中压开关柜

一种降低转向节磕碰伤的模具

一种舌肌训练装置

推理相关技术

模型推理方法、装置、电子设备及存储介质_上海壁仞科技股份有限公司_202411183691.3

基于知识推理的土壤侵蚀类型预测方法_河北工业大学_202411102649.4

基于标签语义的动态属性网络层次标签推理方法_天津大学合肥创新发展研究院_202410972587.6

一种基于LLM模型的推理计算方法和装置_蚂蚁科技集团股份有限公司_202411320262.6

一种基于模糊推理算法的驾驶员权限分配策略_台州学院_202411022005.4

基于RKNN的边缘网关实时视频推理方法及系统_浪潮通信技术有限公司_202410920003.0

一种基于向量数据库进行问答推理的方法及装置_支付宝(杭州)信息技术有限公司_202411074787.6

基于隐私求交实现安全三方推理的方法_公安部第三研究所_202411115362.5

一种面向多边缘设备的Transformer模型协同推理方法_北京理工大学_202410844642.3

一种用于资源受限异构设备的神经网络协同推理方法_北京理工大学_202410844731.8

动态相关技术

行车吊钩动态跟踪方法_深圳盈泰利华技术有限责任公司_202211349438.1

动态传感器分配_威尔乌集团_201980083205.1

数字画笔的动态印章纹理_奥多比公司_201911221005.6

用于确定动态检查过程的系统_声科影像有限公司_202410308202.6

一种动态磁力线显示组件_北京磁与科技有限公司_202323085607.8

用于在WLAN系统中启用动态穿孔的方法_交互数字专利控股公司_202380026020.3

并网功率转换器的动态谐振控制_罗克韦尔自动化技术公司_202110825859.6

介入导管能量波动态控制方法及系统_广东博迈医疗科技股份有限公司_202410899577.4

一种动态离焦调节系统_上海睿视健康科技有限公司_202411077012.4

一种ADC采样时钟的动态调相方法_天津云遥宇航科技有限公司_202411321440.7

机制相关技术

一种机制砂防堵仓下料装置_中建西部建设北方有限公司_202420705188.9

用于破坏性信号发现的机制_上海诺基亚贝尔股份有限公司_202280093321.3

一种机制砂制备用烘干结构_湖北年泰环保建材有限公司_202420467300.X

一种机制砂用取样装置_保利长大工程有限公司_202410993833.6

一种混凝土用机制砂筛分装置_烟台永汇通建材有限公司_202420456486.9

结合注意力机制与MSCNN+BiLSTM的入侵检测方法及系统_上海电力大学_202410798428.9

一种融合谱聚类和信誉值机制的区块链分片方法_广东工业大学_202211021605.X

一种基于邻域和网格注意力机制的卷积神经网络_山东交通学院_202411323240.5

一种基于插件机制的自动生成注释提示的方法_广州助蜂网络科技有限公司_202410938390.0

基于内存上下文机制的数据内存管理方法与相关产品_中电科金仓(北京)科技股份有限公司_202411048121.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于条件化早退机制的动态推理路径目标跟踪方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务