买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安电子科技大学
摘要:本发明提出了一种基于量子Grover算法的音频指纹检索方法,其实现步骤是:1生成音频指纹集合;2提取待检索音频的音频指纹;3计算待检索音频指纹与音频指纹集合中所有指纹之间的相似度;4使用Grover算法搜索最大相似度的索引;本发明计算待检测音频的音频指纹与音频指纹集合中每个音频指纹之间的相似度,保证检索准确率,再利用量子Grover算法搜索所有相似度中的最大相似度的索引,克服了搜索需要的步骤与相似度集合中元素数量成线性正比关系的问题,使得本发明提高了音频指纹检索的效率。
主权项:1.一种基于量子Grover算法的音频指纹检索方法,其特征在于,计算待检测音频的音频指纹与音频指纹集合中每个音频指纹之间的相似度,利用量子Grover算法搜索所有相似度中的最大相似度的索引,该方法的具体步骤包括如下:1生成音频指纹集合:1a采集至少100段音频,每段音频的时长不等且小于3min;1b使用整数倍数降采样算法,降采样率fs=16000Hz,对每段音频进行降采样;1c提取降采样后每段音频的音频指纹,将所有采集的音频指纹组成音频指纹集合;所述提取降采样后每段音频的音频指纹的步骤如下:第一步,按照下式,对每段降采样后音频进行分帧:Xul=xu·wl其中,Xul表示第u段降采样音频分帧后的第l帧,u=1,2,...,v,v表示降采样后音频的总段数,xu表示第u段降采样后音频,w·表示汉明窗函数;第二步,对每段降采样后音频的每一帧进行傅里叶变换,得到该帧对应的频域信号;第三步,从每一帧频域信号中选取频率为300Hz到2000Hz间的所有信号组成该帧频域信号的频带;第四步,使用33个带通滤波器,将每个频带划分成33个子频带;第五步,按照下式,从每个相邻子频带中提取一个元素,将提取的所有元素组成一个子指纹: 其中,fm表示第m个子频带与第m+1个子频带中提取的元素,Em表示第m个子频带的能量,K表示第m个子频带的结束频率,k1表示第m个子频带的起始频率,Ymk表示第m个子频带的第k个频率的频域信号,|·|表示绝对值操作;第六步,将每段降采样后音频的所有帧的子指纹组成该段音频对应的音频指纹;2提取待检索音频的音频指纹:采用与步骤1b、步骤1c相同的方法,对待检索音频进行降采样后提取该待检索音频的音频指纹;3计算待检索音频指纹与音频指纹集合中所有指纹之间的相似度:3a从音频指纹集合中依次选取一个音频指纹;3b计算待检索音频指纹与所选音频指纹之间的编辑距离;3c按照下式,计算待检索音频指纹与所选音频指纹之间的相似度: 其中,S表示待检索音频指纹与所选音频指纹之间的相似度,C表示待检索音频指纹与所选取音频指纹之间的编辑距离,max表示取最大值操作,L表示待检索音频指纹的长度,M表示所选音频指纹的长度;3d重复执行步骤3a、步骤3b、步骤3c,直到选取完指纹集合中所有指纹,得到待检索音频指纹与音频指纹集合中每个指纹之间的相似度;4使用Grover算法搜索最大相似度的索引:4a将所有相似度按照音频指纹采集顺序组成一个音频指纹相似度向量;4b利用对应函数,建立音频指纹相似度向量的每个元素与制备的量子位的每个量子状态之间的映射关系;4c从音频指纹相似度向量中随机取出一个元素,利用匹配函数分别计算所选元素与量子位产生的每个量子状态映射的元素匹配值,再使用翻转函数将映射的元素与所选元素匹配后的每个量子状态的概率幅进行翻转;4d重复执行步骤4c次,从量子位产生的所有量子状态中找出概率幅最大的量子状态,将该概率幅最大的量子状态映射元素的索引作为音频指纹相似度向量中最大相似度的索引,其中,N表示音频指纹相似度向量的长度。
全文数据:
权利要求:
百度查询: 西安电子科技大学 基于量子Grover算法的音频指纹检索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。