买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:电子科技大学
摘要:本发明提出了一种基于插值小波与塔式分解的英文长元音e识别方法,属于语音识别领域。该方法将预处理后的长元音"e"的音频样本信号{En}输入系统,结合对偶插值滤波器系数,获得插值小波分解系数并进行塔式分解,然后在能量分布最高的第四、五、六尺度空间中提取小波系数并进行傅里叶变换得到信号的频谱,提取出关键的特征点并记录其分布范围,得到第四空间的对应范围是[0.2,0.4]∪[2.5,3.1],第五空间的对应范围是[2.2,2.7]∪[3.0,3.1],第六空间的对应范围是[0.1,0.2]∪[1.5,1.8]∪[3.0,3.1]。将这些特征点的总和及其分布范围整合为特征信息,与标准长元音"e"的特征信息进行细致的比较,验证了本发明方法的有效性和优越性。
主权项:1.一种基于插值小波与塔式分解的英文长元音e识别方法,该方法具体步骤如下:步骤1对原音频进行采样获得音频信号表示为数组{en};步骤2取数组{en}的最大值记为emax,最小值记为emin;步骤3对读取到的音频数组{en}进行归一化处理,将其记为{e*n}; e为数组{en}中的音频元素;步骤4对归一化处理后得到的音频数组{e*n}进行阈值处理,选定阈值为Q=0.01,将得到的数组记为{En},En为数组中的第n个数据, 步骤5计算低通滤波器系数记为{Ln}n=[-15,15]n为整数,{Ln}={L-15......L15}3步骤6计算高通滤波器系数记为{Hn}n=[-15,15]其中n为整数,{Hn}={H-15......H15}4步骤7计算所对应的对偶低通插值滤波器系数{Dn}n=[-15,15]n为整数,{Dn}={D-15......D15}5步骤8基于下式计算第零空间内的小波系数其中m为序列{En}的数据长度,{Dn}为步骤5中计算得到的对偶低通插值滤波器系数, 其中的长度为l;步骤9将步骤8计算结果带入下式,计算第一空间内的小波系数 其中的长度为l,步骤10将步骤9计算结果带入下式,计算第二空间内的小波系数 其中的长度为l,步骤11将步骤10计算结果带入下式,计算第三空间内的小波系数 其中的长度为l,步骤12将步骤11计算结果带入下式,计算第四空间内的小波系数 其中的长度为l,步骤13将步骤12计算结果带入下式,计算第五空间内的小波系数 其中的长度为l,步骤14将步骤13计算结果带入下式,计算计算第六空间内的小波系数 其中的长度为l,步骤15保留步骤12、13、14中的计算结果,即保留计算分解过程中的步骤16对得到的小波分解系数进行离散傅里叶变换, 其中,N表示滤波器个数;计算出所有k对应的G4k、G5k、G6k,组成{G4},{G5},{G6};步骤17对{G4},{G5},{G6}按式14进行处理,并将结果记为{G4*},{G5*},{G6*},称为特征点: 其中,Gn表示中{G4},{G5},{G6}中的第n个数,Gn-1为{G4},{G5},{G6}数组中的第n-1个数,Gn+1为{G4},{G5},{G6}中的第n+1个数,N为{G4},{G5},{G6}的数组长度,Gn所对应的计算结果记为G*n;步骤18计算所有特征点之和, 步骤19判断F4是否小于0.02,如果是则进行步骤20,否则判断不是"e"音;步骤20记G4*n非零区间为集合A,设B=[0.2,0.4]∪[2.5,3.1],这里∪表示并集,如果A∈B则进行步骤21,则判断不是"e"音;步骤21判断F5是否小于0.02,如果是则进行步骤22,否则判断不是e音;步骤22记G5*n非零区间为集合A,设B=[2.2,2.7]∪[3.0,3.1]。如果A∈B则进行步骤23,则判断不是"e"音;步骤23判断F6是否小于0.02,如果是则进行步骤24,否则判断不是e音;步骤24记G6*n非零区间为集合A,设B=[0.1,0.2]∪[1.5,1.8]∪[3.0,3.1],如果A∈B则判断是e音,则判断不是"e"音;步骤25根据步骤19-25输出判断结果“音频为长元音"e"”或“音频不为长元音"e"”。
全文数据:
权利要求:
百度查询: 电子科技大学 一种基于插值小波与塔式分解的英文长元音e识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。