首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

联合GIST特征的多重索引图像检索方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安理工大学

摘要:本发明公开的联合GIST特征的多重索引图像检索方法:对参考图像库中图像提取局部SIFT特征,根据局部SIFT特征中的坐标信息建立GIST特征;用局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;根据二维BOF特征模型建立基于二维BOF的投票检索模型;根据SIFT特征与GIST特征结合基于BOF特征的二维倒排表索引,对SIFT特征与GIST进行汉明量化处理,将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到基于BOF的投票检索模型中,精确检索近似重复图像。本发明的多重索引图像检索方法实现在大规模数据图像中完成对近似重复图像的检索。

主权项:1.联合GIST特征的多重索引图像检索方法,其特征在于,具体按照以下步骤实施:步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征;步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型;步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中,在大规模的数据中精确检索近似重复图像,所述步骤1具体按照以下步骤实施:步骤1.1、对参考图像库中的图像进行图像标准化处理,将每幅图像的像素总数控制到固定个数;步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取;SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法;对每幅图像提取SIFT特征,提取的信息包括有:特征点的位置信息、尺度信息、角度信息以及局部描述信息;步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征;GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法,对每个SIFT特征点的相邻区域提取GIST特征,提取的信息为特征点相邻区域的描述信息,所述步骤2具体按照以下方法实施:用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练,生成两个类;进行量化生成每幅图像的BOF特征,具体方法如下:量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理;再判断在各自的量化过程中与哪个类中心最近,则放入该类中心;然后将生成一张频数表,即初步的无权BOF;最后通过tf-idf对频数表加上权重,生成最终的加权BOF特征;其中,对查询图像的特征进行量化方法,具体按照以下算法实施: 在式1中:q:表示量化,Rd表示实数空间中的d维数据,k表示类中心的数量,xp,p=1,...,r2为参考图像库中图像的第p个特征,qxp表示把特征xp量化成为[1,k]中的某个数值;计算tf-idf权值方法,具体按照以下算法实施: Wu,v=tfu,v·idfu,v4;在式2~式4中:k1表示SIFT特征类中心的数量,k2表示GIST特征类中心的数量,fu,v是每幅图像中的特征点划分到第u个SIFT类中心并且第v个GIST类中心的频数,tu,v是特征点划分到第u个SIFT类中心并且第v个GIST类中心的参考图像总数,T是总的参考图像数,tfu,v表示词频率因子,idfu,v表示逆词频率因子;对生成的BOF特征建立二维倒排索引,具体方法为:二维倒排索引是由量化表文件和倒排表文件两部分组成;量化表文件记录了文档集中出现的所有词汇;倒排表文件是将每个词汇在记录文件中的位置、频率和逆词频率信息都记录下来,所有词汇的这些信息就构成倒排表;对于量化表文件中的k1*k2个词汇w1,1...wm,n中的一个wu,v,在所有记录文件,中的倒排表能表示为如下形式: 式5中:表示不同频率下的方向和尺度信息,g表示频率,并给出了一个完整的用于查询文本词汇的倒排索引结构;k1*k2条这样的记录能构成一个完整的倒排表,所述步骤3具体按照以下步骤实施:给定一个查询图像,其中所有特征用y表示,局部SIFT特征用y1表示、GIST特征用y2表示,并且图像数据库中图像的特征用xj表示,局部SIFT特征用x1j表示、GIST特征用x2j表示,j=1,...,n,基于BOF投票检索的步骤具体如下;步骤3.1、对于查询图像的特征yl,l=1,...,r1和图像数据库中所有图像的特征xi,j,i=1,...,r2,j=1,...,s,l、i表示各自图像的特征序号,j表示图像库中的图像序号,计算出两个图像之间的相似性分数sj,其算法具体如下: 式6中:fa,b是一个匹配函数,它反映了两个特征组a和b之间的相似性程度;步骤3.2、经步骤3.1后,为了提高运算效率,把特征根据视觉词汇进行量化,并把量化后数据库中图像的特征存储在一个倒排文件中,这个量化过程q采用的是如下算法: qxp表示把特征xp量化成为[1,k]中的某个数值,根据这个原理,考虑到前述的tf-idf权值方法,匹配函数f则定义为如下算法: 表示如果qxi,j=qyl则取值为1,否则取值为0,是根据公式4计算出来的权值,这样能根据量化后的结果高效地比较两个不同的特征;步骤3.3、经步骤3.2后,最终用来排序的图像相似性分数sf是对sj进行后处理后得到的,具体按如下算法实施: 由步骤3.2中的式7和步骤3.3中的式8能看出:同时考虑查询图像和数据库中图像的视觉单词的tf-idf权重,并把它们加入到了基于BOF投票检索方法中,这种权值方法实现了对视觉单词直方图的规一化处理,所述步骤4具体按照以下步骤实施:汉明量化处理采用的是随机生成一个128*128符合高斯分布的矩阵,然后对该矩阵做QR分解,取得到的128*128的正交投影矩阵的前64行,得到64*128的矩阵;使用大量的属于同一个聚类中心的SIFT向量乘以得到的64*128矩阵,即能得到大量64维的SIFT向量,根据这些向量得到一个中值向量,然后将该聚类中心的每个64维的SIFT向量和对应的64维中值向量的每一维比较:若SIFT在该维比中值向量的对应维大则SIFT的汉明信息该维为1,否则为0,依次比较得到汉明量化信息的方法,得到SIFT特征的汉明量化信息Hs与GIST特征的汉明量化信息Hg;若两个特征x和y量化到同一个类中心上反映了它们描述符的汉明距离dhx,y是很小的,则汉明量化信息所描述的网络之间的距离也应该是很小的;在这一点上,一个描述符由qx和b1x、b2x,q是一个量化器,b1表示SIFT特征的汉明量化信息Hs、b2表示GIST特征的汉明量化信息Hg;则把SIFT特征的汉明量化信息Hs、GIST特征的汉明量化信息Hg嵌入到BOF检索模型中,重新定义的匹配函数f的功能,具体算法如下: 式9中:dh表示汉明距离,与分别表示阈值,tf-idfqy表示给qy加tf-idf权重;在量化时类中心数要取小一些的值,尽量让相近的图像能匹配上,而与也相应的要取合适的值,以便于能根据Hs特征与Hg特征的汉明距离去除误匹配的图像且不影响近似图像的匹配结果。

全文数据:联合GIST特征的多重索引图像检索方法技术领域[0001]本发明属于图像分析及检索方法技术领域,具体涉及一种联合GIST特征的多重索引图像检索方法。背景技术[0002]近年来,通信多媒体技术、计算机网络、大容量存储器及数字化图像设备等技术迅速的发展与应用;其中,数字图像的应用涉及国防军事、工业制造、新闻媒体和大众娱乐等各个方面,由此产生了各式各样的图像数据库,信息量呈指数型增长。[0003]如今,每天都有大量的图像在互联网被上传和下载,网络数据库中会保存大量近似重复的图像。为了有序而严谨地运用这些大量近似重复的图像,许多新的理论及运用应运而生,如:图像分类、图像防伪、图像内容分割、图像标注及图像数据库升级维护等等。例如:一个最普遍的情况是,一个网络用户想要搜索一些与某个关键词或图片样本相关的图像,但最终搜索引擎返回了许多重复或无关的图像;另一种情况涉及图像防伪与版权,图像制作者希望版权保护他们的图像,以避免在互联网上共享;这两种情况与需求都需要近似重复图像检索技术来实现。[0004]近年来,近似重复图像检索成为研究的热点。大量的现有方法是使用如下介绍的图像检索框架(J.Sivic,A.Zisserman,“VideoGoogle:atextretrievalapproachtoobjectmatchinginvideos,ProceedingsNinthIEEEInternationalConferenceonComputerVision,vol·2,ρρ·1470_1477,0ct,2003.:首先,通过图像预处理算法对图像进行预处理;其次,对这些图像提取视觉特征,如:尺度不变特征(SIFT及方向梯度直方图HOG等,用若干组视觉特征向量来表示整个图像;最后,系统需要根据视觉特征向量来计算数据库中每幅图像和查询图像之间的相似性,并得到数据库中与查询图像最相似图像名称。在使用这种方法的前提下,通常使用局部特征的描述信息来衡量图像之间的相似程度Y·W·Wang,H·L·Yu,“ImageregistrationmethodbasedonPCA-SIFTfeaturedetection,’,4thInternationalConferenceonManufacturingScienceandEngineering,vol.712-715,pp.2395-2398,Mar,2013.。与之对应,有一些方法是直接对图像整体提取一个全局特征来进行图像检索(H.Jegou,M.Douze,andC·Schmid,“Bag-of-colorsforimprovedimagesearch,’,InternationalConferenceonMultimedea,pp.l437-1440,N〇v,2011.,但这些方法不能实现对尺度不一且背景复杂图像的有效检索D[0005]在最近出现的一些文献中,出现了通过对BOF检索模型进行改良,以此提高图像检索的精度(L.Zheng,S.Wang,Z.Liu,andQ.Tian,“Lp-NormIDFforLargeScaleImageSearch,’,ComputerVisionandPatternRecognition,pp·1626-1633,Jun,2013.A.Babenko?andV.Lempitsky,“TheInvertedMulti_Index,’,PatternAnalysisandMachineIntelligence,vol·37,no·6,pp·1247-1260,2013·D然而,就现有技术而言,许多近似重复图像检索方法都是基于局部特征和BOF检索模型的,但这些方法只利用了单一的局部信息,忽略了特征点的全局分布信息,导致图像检索的精确度不高。发明内容[0006]本发明的目的在于提供一种联合GIST特征的多重索引图像检索方法,能把局部特征描述信息与区域化图像轮廓信息联合于改进的BOF模型中,实现在大规模数据图像中精确完成对近似重复图像的检索。[0007]本发明所采用的技术方案是,联合GIST特征的多重索引图像检索方法,具体按照以下步骤实施:[0008]步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征;[0009]步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;[0010]步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型;[0011]步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中,在大规模的数据中精确检索近似重复图像。[0012]本发明的特点还在于:[0013]步骤1具体按照以下步骤实施:[00M]步骤1.1、对参考图像库中的图像进行图像标准化处理,将每幅图像的像素总数控制到固定个数;[0015]步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取;[0016]SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法;[0017]对每幅图像提取SIFT特征,提取的信息包括有:特征点的位置信息、尺度信息、角度信息以及局部描述信息;[0018]步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征;[0019]GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法,对每个SIFT特征点的相邻区域提取GIST特征,提取的信息为特征点相邻区域的描述信息。[0020]步骤1.1中,将大图控制到1024*768个像素,小图控制到640*480个像素。[0021]步骤2具体按照以下方法实施:[0022]用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练,生成两个类;[0023]进行量化生成每幅图像的BOF特征,具体方法如下:[0024]量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理;再判断在各自的量化过程中与哪个类中心最近,则放入该类中心;然后将生成一张频数表,即初步的无权BOF;最后通过tf-idf对频数表加上权重,生成最终的加权BOF特征;[0025]其中,对查询图像的特征进行量化方法,具体按照以下算法实施:[0027]在式⑴中:q:表示量化,Rd表示实数空间中的d维数据,k表示类中心的数量,Xp,P=1,...,r2为参考图像库中图像的第p个特征;[0028]计算tf-idf权值方法,具体按照以下算法实施:[0032]在式⑵〜式⑷中:ki表示SIFT特征类中心的数量,k2表示GIST特征类中心的数量,fu,v是每幅图像中的特征点划分到第u个SIFT类中心并且第V个GIST类中心的频数,tu,v是特征点划分到第u个SIFT类中心并且第V个GIST类中心的参考图像总数,T是总的参考图像数,tfu,v表示词频率因子,idfu,v表示逆词频率因子;[0033]对生成的BOF特征建立二维倒排索引,具体方法为:[0034]二维倒排索引通常是由量化表文件和倒排表文件两部分组成;量化表文件记录了文档集中出现的所有词汇;倒排表文件是将每个词汇在记录文件中的位置、频率和逆词频率信息都记录下来,所有词汇的这些信息就构成倒排表;对于量化表文件中的lu*k2个词汇中的一个wu,v,在X个记录文件,dr"dx中的倒排表能表示为如下形式:[0036]式5中:g表示频率、方向及尺度信息,并给出了一个完整的用于查询文本词汇的倒排索引结构;la*k2条这样的记录能构成一个完整的倒排表。[0037]步骤3具体按照以下步骤实施:[0038]给定一个查询图像,其中所有特征用y表示,局部SIFT特征用yi表示、GIST特征用y2表示,并且图像数据库中图像的特征用表示,局部SIFT特征用表示、GIST特征用X2J表示,j=l,...,n。基于BOF投票检索的步骤具体如下:[0039]步骤3.1、对于查询图像的特征yi,1=1,...,Γ1和图像数据库中所有图像的特征xi,j,i=l,...,Γ2,j=l,...,s,l、i表示各自图像的特征序号,j表示图像库中的图像序号,计算出两个图像之间的相似性分数其算法具体如下:[0041]式⑶中:fa,b是一个匹配函数,它反映了两个特征组a和b之间的相似性程度;[0042]步骤3.2、经步骤3.1后,为了提高运算效率,把特征根据视觉词汇进行量化,并把量化后数据库中图像的特征存储在一个倒排文件中,这个量化过程q采用的是如下算法:[0044]量化后qXlJ的结果是与特征最近的类中心的序号;因此,若两个特征X^和yi量化后满足qXU=qyi,则这两个特征在高维的特征空间中很接近的概率非常高;根据这个原理,考虑到前述的tf-idf加权方法,匹配函数f则定义为如下算法:[0046]这样能根据量化后的结果高效地比较两个不同的特征;[0047]步骤3.3、经步骤3.2后,最终用来排序的图像相似性分数Sf是对^进行后处理后得到的,具体按如下算法实施:[0049]由步骤3.2中的式7和步骤3.3中的式⑶能看出:同时考虑查询图像和数据库中图像的视觉单词的tf-idf权重,并把它们加入到了基于BOF投票检索方法中,这种加权方法实现了对视觉单词直方图的规一化处理。[0050]步骤4具体按照以下步骤实施:[0051]汉明量化处理采用的是随机生成一个128*128符合高斯分布的矩阵,然后对该矩阵做QR分解,取得到的128*128的正交投影矩阵的前64行,得到64*128的矩阵;[0052]使用大量的属于同一个聚类中心的SIFT向量乘以得到的64*128矩阵,即能得到大量64维的SIFT向量,根据这些向量得到一个中值向量,然后将该聚类中心的每个64维的SIFT向量和对应的64维中值向量的每一维比较:若SIFT在该维比中值向量的对应维大则SIFT的汉明信息该维为1,否则为0,依次比较得到汉明量化信息的方法,得到SIFT特征的汉明量化信息凡与61ST特征的汉明量化信息Hg;[0053]若两个特征X和y量化到同一个类中心上反映了它们描述符的汉明距离dhx,y是很小的,则汉明量化信息所描述的网络之间的距离也应该是很小的;在这一点上,一个描述符由qX和匕X、b2X,q是一个量化器,bi表示SIFT特征的汉明量化信息Hs、b2表示GIST特征的汉明量化信息Hg;则把SIFT特征的汉明量化信息Hs、GIST特征的汉明量化信息Hg嵌入到BOF检索模型中,重新定义的匹配函数f的功能,具体算法如下:[0055]式9中:dh表示汉明距离,\与\分别表示阈值,并且弋与42最理想的值分别22和40;[0056]在量化时类中心数要取小一些的值,20000为最优,尽量让相近的图像能匹配上,而也相应的要取合适的值,以便于能根据凡特征与特征的汉明距离去除误匹配的图像且不影响近似图像的匹配结果。[0057]本发明的有益效果在于:[0058]⑴本发明联合GIST特征的多重索引图像检索方法中提出了一种改进的BOF模型,能明显提尚图像检索的鲁棒性。[0059]2在本发明联合GIST特征的多重索引图像检索方法中,能根据二维BOF模型的特点,将SIFT特征与GIST特征量化运用到二维BOF模型中,增加了BOF模型的特征多样性,从而提尚了系统的稳定性。[0060]3本发明联合GIST特征的多重索引图像检索方法使用时,能大幅提高近重复图像检索的精度,并能广泛应用于图像检索领域。[0061]4本发明联合GIST特征的多重索引图像检索方法也适合于视频检索领域,能大幅提尚视频检索的精度。附图说明[0062]图1是本发明联合GIST特征的多重索引图像检索方法的框架图。具体实施方式[0063]下面结合附图和具体实施方式对本发明进行详细说明。[0064]联合GIST特征的多重索引图像检索方法的框架图,如图1所示的,可将其分为两大系统,分别为:离线系统与在线系统;离线系统是对目标图像库的处理,产生在线体统查询时所需要的二维倒排表数据库;在线系统主要是完成对查询图像在目标图像库中的查询过程。[0065]离线系统的处理对象是参考图像库,对参考图像库中的图像进行SIFT特征提取、GIST特征提取、特征聚类、特征矢量到视觉词汇的量化并生成视觉词汇表、特征汉明量化与关于特征的倒排索引表以供在线部分的使用。[0066]在线系统用于完成对查询图像在参考图像库中的查询;能对查询图像进行SIFT特征提取及GIST特征提取,能根据参考图像库生成的视觉词汇表对在线图像中的特征量化成视觉词汇、特征汉明量化,然后应用信息融合策略把全局几何分布信息融合到BOF模型中,进行候选图像的查找和搜索,得出最终检索结果。[0067]本发明联合GIST特征的多重索引图像检索方法,具体按照以下步骤实施:[0068]步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征,具体按照以下步骤实施:[0069]步骤1.1、对参考图像库中的图像进行图像标准化处理,将每幅图像的像素总数控制到固定个数;[0070]将大图控制到1024*768个像素,小图控制到640*480个像素;[0071]步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取;[0072]SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法;[0073]对每幅图像提取SIFT特征,提取的信息包括有:特征点的位置信息、尺度信息、角度信息以及局部描述信息;[0074]步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征;[0075]GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法,对每个SIFT特征点的相邻区域提取GIST特征,提取的信息为特征点相邻区域的描述信息。[0076]步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型,具体按照以下方法实施:[0077]用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练,生成两个类;[0078]进行量化生成每幅图像的BOF特征,具体方法如下:[0079]量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理;再判断在各自的量化过程中与哪个类中心最近,则放入该类中心;然后将生成一张频数表,即初步的无权BOF;最后通过tf-idf对频数表加上权重,生成最终的加权BOF特征;[0080]其中,对查询图像的特征进行量化方法,具体按照以下算法实施:[0082]在式⑴中:q:表示量化,Rd表示实数空间中的d维数据,k表示类中心的数量,Xp,P=1,...,r2为参考图像库中图像的第p个特征;[0083]计算tf-idf权值方法,具体按照以下算法实施:[0087]在式⑵〜式⑷中:ki表示SIFT特征类中心的数量,k2表示GIST特征类中心的数量,fu,v是每幅图像中的特征点划分到第U个SIFT类中心并且第V个GIST类中心的频数,tu,v是特征点划分到第u个SIFT类中心并且第V个GIST类中心的参考图像总数,T是总的参考图像数,tfu,v表示词频率因子,idfu,v表示逆词频率因子;[0088]对生成的BOF特征建立二维倒排索引,具体方法为:[0089]二维倒排索引通常是由量化表文件和倒排表文件两部分组成;量化表文件记录了文档集(图像、图像帧)中出现的所有词汇;倒排表文件是将每个词汇在记录文件(图像、图像帧)中的位置、频率和逆词频率信息都记录下来,所有词汇的这些信息就构成倒排表;对于量化表文件中的kl*k2个词汇特征wi,r"Wm,η中的一个Wu,V,在X个记录文件(图像、图像帧山…心中的倒排表能表示为如下形式:[0091]式5中:g表示频率、方向及尺度信息,并给出了一个完整的用于查询文本词汇的倒排索引结构;la*k2条这样的记录能构成一个完整的倒排表。[0092]步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型,具体按照以下步骤实施:[0093]给定一个查询图像,其中所有特征用y表示局部SIFT特征用yi表示、GIST特征用y2表示),并且图像数据库中图像的特征用X谦示(局部SIFT特征用表示、GIST特征用明表示),j=l,...,n。基于BOF投票检索的步骤具体如下:[0094]步骤3.1、对于查询图像的特征yi,1=1,...,ri和图像数据库中所有图像的特征xi,j,i=l,...,Γ2,j=I,...,sl、i表示各自图像的特征序号,j表示图像库中的图像序号),计算出两个图像之间的相似性分数其算法具体如下:[0096]式⑶中:fa,b是一个匹配函数,它反映了两个特征组a和b之间的相似性程度;[0097]步骤3.2、经步骤3.1后,为了提高运算效率,把特征根据视觉词汇进行量化,并把量化后数据库中图像的特征存储在一个倒排文件中,这个量化过程q采用的是如下算法:[0099]量化后qXlJ的结果是与特征最近的类中心视觉词汇的序号;因此,若两个特征xi,j和yi量化后满足qxi,j=qyi,则这两个特征在高维的特征空间中很接近的概率非常高;根据这个原理,考虑到前述的tf-idf加权方法,匹配函数f则定义为如下算法:[0101]这样能根据量化后的结果高效地比较两个不同的特征;[0102]步骤3.3、经步骤3.2后,最终用来排序的图像相似性分数Sf是对Sj进行后处理后得到的,具体按如下算法实施:[0104]由步骤3.2中的式7和步骤3.3中的式8能看出:同时考虑查询图像和数据库中图像的视觉单词的tf-idf权重,并把它们加入到了基于BOF投票检索方法中,这种加权方法实现了对视觉单词直方图的规一化处理。[0105]步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中,在大规模的数据中精确检索近似重复图像,具体按照以下方法实施:[0106]汉明量化处理采用的是随机生成一个128*128符合高斯分布的矩阵,然后对该矩阵做QR分解,取得到的128*128的正交投影矩阵的前64行,得到64*128的矩阵;[0107]使用大量的属于同一个聚类中心的SIFT向量乘以得到的64*128矩阵,即能得到大量64维的SIFT向量,根据这些向量得到一个中值向量,然后将该聚类中心的每个64维的SIFT向量和对应的64维中值向量的每一维比较:若SIFT在该维比中值向量的对应维大则SIFT的汉明信息该维为1,否则为0,依次比较得到汉明量化信息的方法,得到SIFT特征的汉明量化信息凡与61ST特征的汉明量化信息Hg;[0108]若两个特征X和y量化到同一个类中心上反映了它们描述符的汉明距离dhx,y是很小的,则汉明量化信息所描述的网络之间的距离也应该是很小的;在这一点上,一个描述符由qX和匕X、b2X,q是一个量化器,bi表示SIFT特征的汉明量化信息Hs、b2表示GIST特征的汉明量化信息Hg;则把SIFT特征的汉明量化信息Hs、GIST特征的汉明量化信息Hg嵌入到BOF检索模型中,重新定义的匹配函数f的功能,具体算法如下:[0110]式9中:dh表示汉明距离分别表示阈值,并且最理想的值分别22和40;[0111]在量化时类中心数要取小一些的值20000为最优),尽量让相近的图像能匹配上,而\与也相应的要取合适的值,以便于能根据札特征与特征的汉明距离去除误匹配的图像且不影响近似图像的匹配结果。[0112]本发明联合GIST特征的多重索引图像检索方法,从功能运行上,首先执行对数据库中图像标准化处理,提取局部SIFT特征;其次执行根据获取的局部SIFT特征中的坐标信息建立GIST特征;然后执行利用局部SIFT特征与GIST特征的描述符信息建立二维BOF特征模型;接下来执行根据二维BOF特征模型,建立基于二维BOF的投票检索模型;最后执行应用信息融合策略把汉明量化信息融合到建立的基于二维BOF的投票检索模型中,在大规模的数据库中精确地检索近似重复图像。[0113]本发明联合GIST特征的多重索引图像检索方法,充分利用了局部纹理信息和区域化轮廓信息,并提出了一种特征并行联合的方法,能够把局部纹理信息和区域化轮廓信息联合于二维BOF模型中,并且根据信息融合策略把汉明量化信息融合于二维BOF模型中,实现在大规模的数据中精确地检索近似重复图像。

权利要求:1.联合GIST特征的多重索引图像检索方法,其特征在于,具体按照以下步骤实施:步骤1、对参考图像库中图像提取局部SIFT特征,根据获取的局部SIFT特征中的坐标信息建立GIST特征;步骤2、将一维BOF模型升维成二维BOF模型,利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型;步骤3、根据步骤2中得到的二维BOF特征模型,建立基于二维BOF的投票检索模型;步骤4、先根据步骤1得到的SIFT特征与GIST特征,结合步骤2得到的基于BOF特征的二维倒排表索引,对SIFT特征与GIST分别进行汉明量化处理;再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中,在大规模的数据中精确检索近似重复图像。2.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1、对参考图像库中的图像进行图像标准化处理,将每幅图像的像素总数控制到固定个数;步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取;SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法;对每幅图像提取SIFT特征,提取的信息包括有:特征点的位置信息、尺度信息、角度信息以及局部描述信息;步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征;GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波,将滤波后得到的图像划分为网格,在每个网格内部取平均值,最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法,对每个SIFT特征点的相邻区域提取GIST特征,提取的信息为特征点相邻区域的描述信息。3.根据权利要求2所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤1.1中,将大图控制到1024*768个像素,小图控制到640*480个像素。4.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤2具体按照以下方法实施:用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练,生成两个类;进行量化生成每幅图像的BOF特征,具体方法如下:量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理;再判断在各自的量化过程中与哪个类中心最近,则放入该类中心;然后将生成一张频数表,即初步的无权B0F;最后通过tf-idf对频数表加上权重,生成最终的加权BOF特征;其中,对查询图像的特征进行量化方法,具体按照以下算法实施:在式(1中:q:表示量化,Rd表示实数空间中的d维数据,k表示类中心的数量,Xp,p=1,...,r2为参考图像库中图像的第p个特征;计算tf-idf权值方法,具体按照以下算法实施:在式⑵〜式⑷中:ki表示SIFT特征类中心的数量,k2表示GIST特征类中心的数量,fu,v是每幅图像中的特征点划分到第u个SIFT类中心并且第V个GIST类中心的频数,tu,v是特征点划分到第u个SIFT类中心并且第V个GIST类中心的参考图像总数,T是总的参考图像数,tfu,v表示词频率因子,idfu,v表示逆词频率因子;对生成的BOF特征建立二维倒排索引,具体方法为:二维倒排索引通常是由量化表文件和倒排表文件两部分组成;量化表文件记录了文档集中出现的所有词汇;倒排表文件是将每个词汇在记录文件中的位置、频率和逆词频率信息都记录下来,所有词汇的这些信息就构成倒排表;对于量化表文件中的lu*k2个词汇W1,r··Wmp11I11的一个wu,V,在X个记录文件,dr"dx中的倒排表能表示为如下形式:式5中:g表示频率、方向及尺度信息,并给出了一个完整的用于查询文本词汇的倒排索引结构;la*k2条这样的记录能构成一个完整的倒排表。5.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤3具体按照以下步骤实施:给定一个查询图像,其中所有特征用y表示,局部SIFT特征用yi表示、GIST特征用y2表示,并且图像数据库中图像的特征用Xj表示,局部SIFT特征用Xlj表示、GIST特征用X2j表示,j=1,...,n。基于BOF投票检索的步骤具体如下:步骤3.1、对于查询图像的特征yi,1=1,...,ri和图像数据库中所有图像的特征Xi,j,i=1,...,r2,j=l,...,s,l、i表示各自图像的特征序号,j表示图像库中的图像序号,计算出两个图像之间的相似性分数Sj,其算法具体如下:式6中:fa,b是一个匹配函数,它反映了两个特征组a和b之间的相似性程度;步骤3.2、经步骤3.1后,为了提高运算效率,把特征根据视觉词汇进行量化,并把量化后数据库中图像的特征存储在一个倒排文件中,这个量化过程q采用的是如下算法:量化后qXU的结果是与特征最近的类中心的序号;因此,若两个特征和yi量化后满足qX1J=qyi,则这两个特征在高维的特征空间中很接近的概率非常高;根据这个原理,考虑到前述的tf-idf加权方法,匹配函数f则定义为如下算法:这样能根据量化后的结果高效地比较两个不同的特征;步骤3.3、经步骤3.2后,最终用来排序的图像相似性分数Sf是对^进行后处理后得到的,具体按如下算法实施:由步骤3.2中的式⑵和步骤3.3中的式⑶能看出:同时考虑查询图像和数据库中图像的视觉单词的tf-idf权重,并把它们加入到了基于BOF投票检索方法中,这种加权方法实现了对视觉单词直方图的规一化处理。6.根据权利要求1所述的联合GIST特征的多重索引图像检索方法,其特征在于,所述步骤4具体按照以下步骤实施:汉明量化处理采用的是随机生成一个128*128符合高斯分布的矩阵,然后对该矩阵做QR分解,取得到的128*128的正交投影矩阵的前64行,得到64*128的矩阵;使用大量的属于同一个聚类中心的SIFT向量乘以得到的64*128矩阵,即能得到大量64维的SIFT向量,根据这些向量得到一个中值向量,然后将该聚类中心的每个64维的SIFT向量和对应的64维中值向量的每一维比较:若SIFT在该维比中值向量的对应维大则SIFT的汉明信息该维为1,否则为〇,依次比较得到汉明量化信息的方法,得到SIFT特征的汉明量化信息Hs与GIST特征的汉明量化信息Hg;若两个特征X和y量化到同一个类中心上反映了它们描述符的汉明距离dhx,y是很小的,则汉明量化信息所描述的网络之间的距离也应该是很小的;在这一点上,一个描述符由qX和匕X、b2X,q是一个量化器,h表示SIFT特征的汉明量化信息Hs、b2表示GIST特征的汉明量化信息Hg;则把SIFT特征的汉明量化信息Hs、GIST特征的汉明量化信息Hg嵌入到BOF检索模型中,重新定义的匹配函数f的功能,具体算法如下:式9中:dh表示汉明距离,\与\分别表示阈值,并且^与\:最理想的值分别22和40;在量化时类中心数要取小一些的值,20000为最优,尽量让相近的图像能匹配上,而与也相应的要取合适的值,以便于能根据凡特征与Hg特征的汉明距离去除误匹配的图像且不影响近似图像的匹配结果。

百度查询: 西安理工大学 联合GIST特征的多重索引图像检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。