一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统

导航：龙图腾网> 最新专利技术> 一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：安徽大学

摘要：一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统，属于计算机视觉技术领域，解决如何为基于鲁棒实例表示的RGBT跟踪找到最佳的融合网络结构，从而进一步提高跟踪性能的问题，本发明的技术方案在离线搜索阶段，为了提取对光照变化、运动模糊和尺度变化等各种挑战具有鲁棒性的共享特征表示，引入了多域学习框架来离线搜索通用融合空间中的融合网络结构。在线跟踪阶段，从实例感知的融合空间中，在线搜索每个视频序列的融合结构以应对特定于实例的挑战；这种两阶段搜索算法可以动态更新视频融合策略，从而为基于鲁棒实例表示的RGBT跟踪找到合适的融合网络结构，进一步提高跟踪性能。

主权项：1.一种基于两阶段融合结构搜索的RGBT视觉跟踪方法，其特征在于，包括以下步骤：S1、离线搜索阶段，设计一个通用搜索空间，同时输入一对配准的多模态图像，通过使用多域学习的训练方式以及基于预测器的渐进式搜索方法，离线搜索通用的融合网络结构，使用搜索到的通用的融合网络结构提取图像特征；所述的通用搜索空间包括VGG-M卷积层不同融合的方式以及五种激活函数：Tanh、ReLU、PReLU、LReLU、ReLU6；所述的离线搜索通用的融合网络结构是由堆叠一系列的卷积层、非线性层和池化层所组成；离线搜索阶段具体包括以下步骤：（1）首先使用VGG-M的预训练模型的前三层初始化特征提取器的参数，全连接层是随机初始化的；特征提取器由三个卷积层和激活函数Relu组成，其中前两层有局部响应函数LRN以及最大值池化层函数MaxPool，而卷积核大小分别为7*7*96、5*5*256、3*3*512；（2）初始化融合层数L=1的候选结构描述，根据描述构造融合网络，使用多域方法将融合网络进行训练；（3）使用人工标注好的可见光热红外数据集来训练整个网络，用K个视频来做训练，一共做N次循环，每次循环使用随机梯度法进行K次迭代；在第k次迭代，每个minibatch是从第个视频序列中随机抽取八帧配对的可见光和热红外图片通过高斯分布采样生成的，同时更换对应视频序列的第个层；卷积层学习率设置为0.0001，全连接层的学习率设置为0.0002；保存模型，进行测试，得到网络真实的精度；（4）用步骤（2）中的候选结构描述和对应的真实精度，使用随机梯度下降去训练一个模型预测器，学习率设置为0.001，迭代50次；（5）依次扩展融合层数L=2...4，生成候选结构描述，通过预测器预测候选结构的精度，根据预测精度采样前G个结构描述，根据描述构造前G个融合网络，使用步骤（3）进行训练，然后进行测试，得到网络真实精度；再将这些结构描述和精度去更新预测器；（6）最后得到一个最好的融合网络结构，保存该模型，用于在线跟踪阶段，在线跟踪阶段将其进行固定；S2、在线跟踪阶段，将所述的通用的融合网络结构进行固定，在第一层全连接层处设计一个实例感知搜索空间，根据每个视频的第一帧来选择全连接层的融合网络结构，在后续帧的跟踪中继续使用这一融合网络结构；所述的实例感知搜索空间的模态融合方式包括：加法、减法、取最大值、取最小值、取平均值和拼接；在线跟踪阶段具体包括以下步骤：（1）根据多模态视频序列中提供的一对第一帧真值框，抽取个正样本和个负样本作为训练样本，训练迭代次数设置为30次；使用这5500个样本分别初始化六种网络模型，分别得到新的层；此时固定卷积层的学习率，的学习率设置为0.001，前两个全连接层学习率设置为0.0005；然后计算500个正样本在六种网络模型中的得分，选取得分最大的样本所在的结构作为该视频的融合结构，后续帧继续沿用此融合结构，初始化结束后，把前一帧的目标位置求均值，使用高斯分布采样，以为协方差，产生256个候选样本，其中r为前一帧目标框的宽和高的平均值；（2）将候选样本送入到特征提取网络，分别将最后一个卷积层不同模态的特征图和经过通用融合网络之后的特征图送入不同的全连接层fc4_R、fc4_T、fc4_F，将fc4_R和fc4_T按照上一个步骤选择的融合结构进行融合得到一个向量，然后再和fc4_F进行通道维度的拼接，继续传入下一层的全连接层，在最后一层全连接层送入softmax函数得到二分类得分，分别记为和,而下一帧的目标位置再由下式产生：，其中，表示采样的第i个样本，为预测的目标位置；（3）当目标的得分大于零时，判定为跟踪成功；在当前帧进行正负样本采样，包含50个正样本和200个负样本，把它们加入到正负样本数据集中；在正负样本数据集中帧数超过100个则抛弃最早的那些帧的正样本区域，帧数个数若超过20个则抛弃最早的那些帧的负样本区域；当目标得分小于零时，即跟踪失败时将进行短期更新，从正负样本集中抽出32个正样本和96个负样本微调全连接层的参数，迭代10次，学习率设置为0.00003；S3、把得到的图像特征在最后一个全连接层后送入softmax层，得到样本的得分，正样本中得分最高的就是预测的目标跟踪结果，并根据跟踪结果的成功与否判断是否更新融合网络结构。

全文数据：

权利要求：

百度查询：安徽大学一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种对话数据集的构建方法、系统及电子设备

下一篇：一种海洋污水处理装置

相关技术

一种对话数据集的构建方法、系统及电子设备

一种海洋污水处理装置

抗猪IgG抗体及其应用

一种宫颈细胞基因甲基化检测试剂盒及检测方法

基于RDMA的通信装置以及系统

一种基于双模态融合注意力机制YOLOv8的电力绝缘子缺陷检测方法

水稻OsABCC1基因及其突变体序列在调控稻米镉积累方面的方法和应用

一种具有棱镜聚光功能的高照度功能性LED灯

图像下采样方法及装置、电子设备、芯片、存储介质

一种耐高温铸造铝合金

一种基于激光雷达的工程车辆定位方法、装置

改善化学机械研磨后晶圆面内均一性的方法

RGBT相关技术

一种基于孪生结构和Transformer特征融合的RGBT目标跟踪方法_广东工业大学_202410677884.8

一种基于可见光引导的多注意力RGBT目标跟踪方法_电子科技大学_202410480156.8

一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统_安徽大学_202111144930.0

一种基于跨模态特征自增强与逐级融合的RGBT目标跟踪方法_广东朗翼智能科技有限公司_202410072551.2

一种跨模态上下文感知网络的RGBT人群计数方法_中航华东光电(上海)有限公司_202410202421.6

基于多阶段注意力机制的RGBT无人机目标跟踪方法及系统_中国人民解放军军事科学院国防科技创新研究院_202310035520.5

基于特征增强融合的RGBT实时目标跟踪方法和装置_中国人民解放军国防科技大学_202311442820.1

一种基于协同低秩图模型的RGBT目标跟踪方法及系统_安徽大学_202110987298.X

一种基于目标感知增强融合结构的RGBT目标跟踪方法_常熟理工学院_202311824466.9

一种基于运动模型和外观模型的RGBT目标跟踪方法_电子科技大学_202311246375.1

搜索相关技术

废弃巷道搜索钻进方法_中煤能源研究院有限责任公司_202410922839.4

一种搜索结果的排序方法、装置、设备以及存储介质_北京达佳互联信息技术有限公司_202111277526.0

一种数据搜索方法及装置、存储介质、计算机程序产品_中国移动通信有限公司研究院_202410876901.0

一种在PDMS中搜索适宜创建模块的管道集合的方法_中国核工业二三建设有限公司_202311039249.9

基于实例分割和空间搜索约束的番茄植株检测方法和系统_苏州大学_202410790588.9

用于确定搜索空间中的对象的身份和位置的方法和系统_沃特世科技公司_202380022706.5

基于终端多接入能力的多小区搜索方法、系统、介质及终端_上海大学_202411008961.7

搜索结果确定方法、装置、电子设备和存储介质_北京字跳网络技术有限公司_202410910673.4

基于KAN和自适应梯度优化的神经网络参数搜索算法_青岛理工大学_202411336395.2

一种旋转相控阵雷达风扰补偿搜索任务调度方法_中国船舶集团有限公司第七二四研究所_202111157935.7

视觉相关技术

视觉传感器、图像处理设备以及视觉传感器的操作方法_三星电子株式会社_202411134639.9

车头背视觉检测打印机_深圳鼎力数码科技有限公司_202421313401.8

增强现实视觉或听觉反馈_斯纳普公司_202380027592.3

视觉辅助方法、系统及存储介质_上海司南导航技术股份有限公司_202410925526.4

一种机器视觉堆垛机_浙江同济科技职业学院_202411056520.4

鲁棒的视觉转换器_辉达公司_202380026466.6

一种视觉检测应用平台_博业(广东)智能科技有限公司_202420408357.2

一种布料视觉检测平台_杭州萧越染织有限公司_202420770688.0

一种视觉传达投影装置_西安工业大学_202420724063.0

具有视觉指示的自动注射器_欧文蒙福德有限公司_202380031209.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于两阶段融合结构搜索的RGBT视觉跟踪方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务