买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江苏大学
摘要:本发明提供了一种基于DWPT‑MFCC与GMM的车内异响声音识别方法,首先通过收纳并采集常见的几种车内异响的声音信号,提取其MFCC特征向量,并针对异响信号非平稳突变的特点,对MFCC的提取过程加以改进,将小波变换带入其计算过程,得到新的特征参数:DWPT‑MFCC,然后对每种异响声音建立GMM模型,训练得到异响声音数据库,最后将采集到的待识别异响信号与库中已建立的模型进行比较,根据最大后验概率估计得到识别结果,达到对异响声音进行识别的目的。能够准确识别车内常见的几种异响声音,为汽车异响测试提供参考,指导相关人员进行车内NVH性能的优化。
主权项:1.一种基于DWPT‑MFCC与GMM的车内异响声音识别方法,其特征在于,包括以下步骤:步骤一,异响信号的采集:在异响半消声实验室中借助声传感器采集车内异响声音信号,步骤二,信号的预处理:首先通过端点检测将突变异响声音从采集的声音信号中分离出来,然后对分离出来信号进行分帧处理,最后对信号进行加窗;步骤三,特征参数的提取:首先将预处理之后的信号进行Mel频率的转换,然后计算其MFCC特征参数值,在计算MFCC特征参数值的过程中,引入小波包变换,得到DWPT‑MFCC参数值,作为异响声音识别的特征参数;步骤四,模型训练:利用提取到的特征参数作为GMM模型训练的参数输入,为每一类异响声音建立GMM模型;最后将训练得到的每种异响的模板存入模板库,用于后续识别模块的匹配识别;步骤五,待测异响的识别:采集待测异响信号,根据步骤二~三的方法对待测异响信号进行预处理、提取特征参数,再与模板库中的异响的模板数据进行模式匹配与辨别,根据最大后验概率法得到识别结果。
全文数据:一种基于DWPT-MFCC与GMM的车内异响识别方法技术领域本发明属于智能检测技术领域,涉及车内异响的声音识别领域,具体涉及一种基于DWPT-MFCC与GMM的车内异响的识别方法。背景技术NVH是指噪声Noise、振动Vibration和声振粗糙度Harshness的简称,是衡量汽车制造质量的一个综合性指标,目前汽车的异响是车企和消费者都十分关注的一个问题。如今在汽车的研发过程中,车企都会针对车内异响进行相关测试,检查是否存在异响故障并进行改进优化。目前整车厂和试验场对异响的检查与测试主要依靠实验人员主观评价的方法来寻找故障点,但是这种方法受限于实验人员的经验水平。另外,目前车企还有通过对异响信号进行信号处理的方法对其进行识别,但是这种方法效率较低,费时费力。声音信号对大多数机器都是敏感的,汽车中正常工作的部件与存在故障的部件在工作时所发出的声音是不同的,并且由于部件的不同和故障产生机理的不同,所发出的异响声音在信号的时频域上存在差别,因此,通过声音特征的提取进行异响的识别和工况的检测是可行的。目前在异响声音的信号处理与特征参数提取中,主要通过寻找信号在时域和频域上的特征来加以区别,例如短时过零率,短时能量和功率谱密度等,或者在频域上对信号进行小波变换提取各频带的能量,作为异响识别的特征参数。但是这些参数都没有考虑到人耳对异响的感受区别,不符合人耳的听觉特性。同时针对异响信号具有随机性,非平稳突变的特点,仅通过信号特征提取分析不能很好的反应出异响信号的特性。在声音识别建模领域,传统的方法主要有隐马尔科夫模型HMM、支持向量机SVM、人工神经网络ANN等。隐马尔科夫模型具有较高的预测精度、适应能力强等优点,但是其精度依赖于特征参数的多少,当特征参数的数量不足时,对其识别精度的影响较大。支持向量机是一种有坚实理论基础的新颖的小样本学习方法,但用SVM解决多分类问题存在困难。人工神经网络对最佳模型拓扑结构的设计的训练算法并不一定能保证收敛,而且会存在过学习的问题。发明内容针对现有技术中存在不足,本发明提出了一种基于DWPT-MFCC与GMM的车内异响识别方法,能够准确识别车内常见的几种异响声音,为汽车异响测试提供参考,指导相关人员进行车内NVH性能的优化。所述的MFCC,全称MelFrequencyCepstrumCoefficient,是梅尔频率倒谱系数是声音识别中主要使用的参数之一。所述GMM,全称GaussianMixtureModel,是高斯混合模型。本发明的目的通过如下技术方案实现:一种基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,包括以下步骤:步骤一,异响信号的采集:在异响半消声实验室中借助声传感器采集车内异响声音信号,步骤二,信号的预处理:首先通过端点检测将突变异响声音从采集的声音信号中分离出来,然后对分离出来信号进行分帧处理,最后对信号进行加窗;步骤三,特征参数的提取:首先将预处理之后的信号进行Mel频率的转换,然后计算其MFCC特征参数值,在计算MFCC特征参数值的过程中,引入小波包变换,得到DWPT-MFCC参数值,作为异响声音识别的特征参数;步骤四,模型训练:利用提取到的特征参数作为GMM模型训练的参数输入,为每一类异响声音建立GMM模型;最后将训练得到的每种异响的模板存入模板库,用于后续识别模块的匹配识别;步骤五,待测异响的识别:采集待测异响信号,根据步骤二~三的方法对待测异响信号进行预处理、提取特征参数,再与模板库中的异响的模板数据进行模式匹配与辨别,根据最大后验概率法得到识别结果。上述方案中,步骤一中采集的车内异响声音种类包括:车窗共振异响、座椅导轨损坏撞击异响、手套箱卡扣配合不当的撞击异响、扶手架共振异响和车门密封条异响;采样频率为48000Hz,背景噪声控制在30dB以内,异响试验台的振动噪声控制在2Sone以内。上述方案中,步骤二中帧长设置为512,帧移设置为256,所加窗函数为Hamming窗。上述方案中,步骤二中端点检测的方法通过信号小波包子带方差参数的检测来实现,若信号某帧的小波包子带方差参数值超过阈值,则认为是随机性异响发生的端点。上述方案中,步骤三中DWPT-MFCC的计算过程如下:1对预处理后的信号的各帧进行3层小波包分解,小波基选择db3,得到8个子频带,求出每一个频带的小波包系数;2对每一个子频带进行傅里叶变换,求取每一层小波包系数的频谱,并对低频近似部分和高频细节部分的频谱进行拼接,将近似系数的频谱放置在第一层,高频细节系数的频谱翻转后按照分辨率由小到大拼接,得到整个信号的新频谱;3将拼接好的频谱通过Mel尺度转换的滤波器组,实现Mel尺度的转换;滤波器组中第m个滤波器的传递函数Hmk表示为:式中,fm是第m个滤波器的中心频率,k指经过傅里叶变换计算后信号采样点的编号;4求对数能量sm式中,Xat是信号第t个采样点的数值,t的范围为0~Q;M是滤波器组中滤波器的总个数,Q表示信号的总采样点数;5进行离散余弦变换DCT,得到改进的DWPT-MFCC特征参数Cn,式中,L为DWPT-MFCC系数的阶数,M是滤波器组中滤波器的个数。上述方案中,步骤四的具体步骤为:将特征参数作为EM算法的输入变量,用EM算法中的E步对待估参量进行似然概率估计,用M步完成混合高斯函数参数的更新,使期望值达到最大,计算每个特征参数落在隐状态的似然概率;然后判断模型是否收敛,若未收敛则继续进行EM算法迭代;最终得到一个异响声音的模板库,用于后续识别过程中的模板匹配。上述方案中,步骤五中将提取的特征参数与模板库中的异响的模板数据进行模式匹配与辨别的识别过程为:GMM模型中包含了Y种异响声音的数据,则分别对应有Y个GMM,分别为λ1,λ2...λY,在识别阶段,对待测异响求得特征向量序列Xi,则认为该种异响是属于异响库中第Y个异响声音的后验概率为Pλi|X;根据贝叶斯理论,最大后验概率表示为:式中,Pλi是事件λi发生的概率,PX为事件X发生的概率,PX|λi为在λi发生的前提下事件X发生的概率;假定该异响声音是训练模板库中每种异响的概率相等,则识别结果根据求取后验概率的最大值推得。上述方案中,所述步骤五中利用声传感器采集待测异响声音信号。上述方案中,所述步骤五中利用智能手机采集待测异响声音信号,智能手机实时与车载主控制器进行数据传输,将采集到的待测信号发送给车载的识别模块进行异响的识别,同时智能手机能够接收识别结果。本发明所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,首先通过收纳并采集常见的几种车内异响的声音信号,提取其MFCC特征向量,并针对异响信号非平稳突变的特点,对MFCC的提取过程加以改进,将小波变换带入其计算过程,得到新的特征参数:DWPT-MFCC,然后对每种异响声音建立GMM模型,训练得到异响声音数据库,最后将采集到的待识别异响信号与库中已建立的模型进行比较,根据最大后验概率估计得到识别结果,达到对异响声音进行识别的目的。在特征参数的提取的过程中,由于人耳对频率的响应与实际频率成非线性关系,两者可按照Mel频率尺度进行换算,故对异响声音信号先进行Mel频率的换算,这样使得声音更加符合人耳的听觉特性。MFCC是基于人耳听觉特性的声音在频域上的特征,但由于MFCC的计算过程中假设声音信号是短时平稳并直接对其做傅里叶变换,这与异响信号非平稳突变的特点不同,容易掩盖异响信号的突变特性,导致识别率下降,故将小波包变换带入MFCC的计算过程,对其进行优化并得到一个新的特征参数DWPT-MFCC,以提高识别精度。本发明的有益效果:1本发明可以实现车内常见的几种异响声音的自动识别,为整车异响实验提供参考,并可用于车内异响的实时监控,辅助汽车NVH性能的优化。2采用改进的特征参数:DWPT-MFCC作为异响声音的识别特征,更好地表现异响声音信号的特点,提高识别率。3异响识别阶段可以采用智能手机作为信号的采集和数据的传输装置,具备简单易行,廉价性的优点。4所采用的GMM模型相比VQ算法具有很好的识别精度,相比HMM算法相对简单,又不需要SVM和ANN算法的太长的训练时间,能够用在实时的系统中,并且可以得到相对满意的识别精度。附图说明图1为本发明所述基于DWPT-MFCC与GMM的车内异响声音识别方法的流程图。图2是本发明中DWPT-MFCC的计算过程图。图3是本发明中GMM模型EM算法的流程图。图4是本发明中提取的车窗共振声的DWPT-MFCC参数图。具体实施方式下面结合附图以及具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。本发明所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,通过在异响半消声实验室中采集车内常见的几种异响声音的信号获取其特征参数,对声音信号进行预处理后进行特侦参数提取,针对传统MFCC参数值对表征非平稳突变信号能力不足的特点,将小波包变换带入其计算过程并加以改进,得到DWPT-MFCC参数,并作为异响声音的识别特征。将提取出的各异响声音的特征参数利用高斯混合模型GMM进行训练,得到异响声音模板库。同时采用智能手机采集车内待测异响信号输入识别模块,利用最大后验概率估计得到识别结果,实现对车内异响声音的识别。如图1所示,本发明所述基于DWPT-MFCC与GMM的车内异响识别方法的具体步骤包括:步骤一,异响信号的采集:在异响半消声实验室中利用异响试验台激起几种常见的车内异响,包括车窗共振异响、座椅导轨损坏撞击异响、手套箱卡扣配合不当的撞击异响、扶手架共振异响和车门密封条异响。借助声传感器进行信号的采集,采样频率设置为48000Hz,背景噪声控制在30dB以内,异响试验台的振动噪声控制在2Sone以内。步骤二,信号的预处理:预处理步骤首先进行端点检测,这是为了能将突变异响声音从信号中检测出来,从而对其进行特征参数的提取。端点检测的方法通过信号小波包子带方差参数的检测来实现,若信号某帧的小波包子带方差参数值超过阈值,则认为是随机性异响发生的端点。由于异响信号是短时突变的,其时变特性决定了需要对其进行分段分析,所以对信号进行分帧处理,同时为了保证分帧不会导致信号的损失,相邻帧之间需要有一定的重叠,称为帧移,通常帧移的长度是帧长的13到12之间。然后对信号进行加窗处理,加窗是为了进行傅里叶展开,同时避免出现吉布斯效应。具体的,帧长设置为512,帧移设置为256,所加窗函数为Hamming窗。步骤三,特征参数的提取:由于人耳对频率的响应与实际频率成非线性关系,两者可按照Mel频率尺度进行换算,故对异响声音信号先进行Mel频率的换算,这样使得声音更加符合人耳的听觉特性。首先将预处理之后的信号进行Mel频率的转换,然后计算其MFCC特征参数值。MFCC是基于人耳听觉特性的声音在频域上的特征,但由于MFCC的计算过程中假设声音信号是短时平稳并直接对其做傅里叶变换,这与异响信号非平稳突变的特点不同,容易掩盖异响信号的突变特性,导致识别率下降。故MFCC特征参数值计算过程中,针对MFCC特征参数对非平稳突变信号的表征能力不足,将小波包变换带入其计算过程,对其进行改进优化,得到DWPT-MFCC参数值,作为异响声音识别的特征参数,以提高识别精度。步骤四,模型训练:利用提取到的特征参数,作为GMM模型训练的参数输入,为每一类异响声音建立GMM模型。最后将训练得到的每种异响的模板存入模板库,用于后续识别模块的匹配识别。步骤五,待测异响的识别:采集待测异响信号,进行预处理并提取特征参数,与异响声音数据库中的数据进行模式匹配与辨别,根据最大后验概率法得到识别结果。具体的:步骤三中DWPT-MFCC的计算过程如下,如图2所示。1对预处理后的信号的各帧进行3层小波包分解,小波基选择db3,得到8个子频带,求出每一个频带的小波包系数。2对每一个子频带进行傅里叶变换,求取每一层小波包系数的频谱,并对低频近似部分和高频细节部分的频谱进行拼接,将近似系数的频谱放置在第一层,高频细节系数的频谱翻转后按照分辨率由小到大拼接,得到整个信号的新频谱。3将拼接好的频谱通过Mel尺度转换的滤波器组,实现Mel尺度的转换。滤波器组中第m个滤波器的传递函数Hmk表示为:式中,fm是第m个滤波器的中心频率,k指经过傅里叶变换计算后信号采样点的编号。4求对数能量sm式中,Xat是信号第t个采样点的数值,t的范围为0~Q;M是滤波器组中滤波器的总个数,Q表示信号的总采样点数;5进行离散余弦变换DCT,得到改进的DWPT-MFCC特征参数。式中,L为DWPT-MFCC系数的阶数,n代表参数中的每一阶,取值范围为1到L,M是滤波器组中滤波器的个数。步骤三中的DWPT-MFCC特征参数向量矩阵中还加入了其一阶和二阶差分,加强帧与帧之间的联系,更好的体现异响信号的动态特性。步骤四中所述,将采集并处理得到的异响声音特征参数作为GMM模型训练的输入,更新模型参数,具体过程如图3所示,采用EM算法。将特征参数作为EM算法的输入变量,用EM算法中的E步对待估参量进行似然概率估计,用M步完成混合高斯函数参数的更新工作,使期望值达到最大,计算每个特征参数落在隐状态的似然概率。然后判断模型是否收敛,若未收敛则继续进行EM算法迭代。最终得到一个异响声音的模板库,用于后续识别过程中的模板匹配。步骤五中,对于一个异响识别系统,其中包含了Y种异响声音的数据,则对应有Y个M阶的GMM,分别为λ1,λ2...λY,在识别阶段,对待测异响求得特征向量序列Xi,则认为该种异响是属于异响库中第Y个异响声音的后验概率为:Pλi|X。根据贝叶斯理论,最大后验概率可表示为:式中,Pλi是事件λi发生的概率,PX为事件X发生的概率,PX|λi为在λi发生的前提下事件X发生的概率。假定该异响声音是训练模板库中每种异响的概率相等,则识别结果可根据求取后验概率的最大值推得。图4给出了对于车窗共振声计算出的DWPT-MFCC参数图,由Matlab计算并按mesh指令画出。其中X坐标为信号的帧数,Y坐标为DWPT-MFCC的阶数,Z坐标为参数值的大小。所述步骤五中,可以利用声传感器采集待测异响声音信号,也可以采用智能手机实时与车载主控制器进行数据传输,将采集到的待测信号发送给车载的识别模块,进行异响的识别,同时控制器将识别模块得到的识别结果传输给智能手机,将识别的异响种类通知给使用者。上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
权利要求:1.一种基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,包括以下步骤:步骤一,异响信号的采集:在异响半消声实验室中借助声传感器采集车内异响声音信号,步骤二,信号的预处理:首先通过端点检测将突变异响声音从采集的声音信号中分离出来,然后对分离出来信号进行分帧处理,最后对信号进行加窗;步骤三,特征参数的提取:首先将预处理之后的信号进行Mel频率的转换,然后计算其MFCC特征参数值,在计算MFCC特征参数值的过程中,引入小波包变换,得到DWPT-MFCC参数值,作为异响声音识别的特征参数;步骤四,模型训练:利用提取到的特征参数作为GMM模型训练的参数输入,为每一类异响声音建立GMM模型;最后将训练得到的每种异响的模板存入模板库,用于后续识别模块的匹配识别;步骤五,待测异响的识别:采集待测异响信号,根据步骤二~三的方法对待测异响信号进行预处理、提取特征参数,再与模板库中的异响的模板数据进行模式匹配与辨别,根据最大后验概率法得到识别结果。2.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤一中采集的车内异响声音种类包括:车窗共振异响、座椅导轨损坏撞击异响、手套箱卡扣配合不当的撞击异响、扶手架共振异响和车门密封条异响;采样频率为48000Hz,背景噪声控制在30dB以内,异响试验台的振动噪声控制在2Sone以内。3.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤二中帧长设置为512,帧移设置为256,所加窗函数为Hamming窗。4.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤二中端点检测的方法通过信号小波包子带方差参数的检测来实现,若信号某帧的小波包子带方差参数值超过阈值,则认为是随机性异响发生的端点。5.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤三中DWPT-MFCC的计算过程如下:1对预处理后的信号的各帧进行3层小波包分解,小波基选择db3,得到8个子频带,求出每一个频带的小波包系数;2对每一个子频带进行傅里叶变换,求取每一层小波包系数的频谱,并对低频近似部分和高频细节部分的频谱进行拼接,将近似系数的频谱放置在第一层,高频细节系数的频谱翻转后按照分辨率由小到大拼接,得到整个信号的新频谱;3将拼接好的频谱通过Mel尺度转换的滤波器组,实现Mel尺度的转换;滤波器组中第m个滤波器的传递函数Hmk表示为:式中,fm是第m个滤波器的中心频率,k指经过傅里叶变换计算后信号采样点的编号;4求对数能量sm式中,Xat是信号第t个采样点的数值,t的范围为0~Q;M是滤波器组中滤波器的总个数,Q表示信号的总采样点数;5进行离散余弦变换DCT,得到改进的DWPT-MFCC特征参数Cn,式中,L为DWPT-MFCC系数的阶数,n代表参数中的每一阶,取值范围为1~L,M是滤波器组中滤波器的个数。6.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤四的具体步骤为:将特征参数作为EM算法的输入变量,用EM算法中的E步对待估参量进行似然概率估计,用M步完成混合高斯函数参数的更新,使期望值达到最大,计算每个特征参数落在隐状态的似然概率;然后判断模型是否收敛,若未收敛则继续进行EM算法迭代;最终得到一个异响声音的模板库,用于后续识别过程中的模板匹配。7.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,步骤五中将提取的特征参数与模板库中的异响的模板数据进行模式匹配与辨别的识别过程为:GMM模型中包含了Y种异响声音的数据,则分别对应有Y个GMM,分别为λ1,λ2...λY,在识别阶段,对待测异响求得特征向量序列Xi,则认为该种异响是属于异响库中第Y个异响声音的后验概率为Pλi|X;根据贝叶斯理论,最大后验概率表示为:式中,Pλi是事件λi发生的概率,PX为事件X发生的概率,PX|λi为在λi发生的前提下事件X发生的概率;假定该异响声音是训练模板库中每种异响的概率相等,则识别结果根据求取后验概率的最大值推得。8.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,所述步骤五中利用声传感器采集待测异响声音信号。9.根据权利要求1所述的基于DWPT-MFCC与GMM的车内异响声音识别方法,其特征在于,所述步骤五中利用智能手机采集待测异响声音信号,智能手机实时与车载主控制器进行数据传输,将采集到的待测信号发送给车载的识别模块进行异响的识别,同时智能手机能够接收识别结果。
百度查询: 江苏大学 一种基于DWPT-MFCC与GMM的车内异响识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。