Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京理工大学朱建良获国家专利权

南京理工大学朱建良获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京理工大学申请的专利一种基于双级搜索MVDR的远场多声源快速定位方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118409278B

龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410494366.2,技术领域涉及:G01S5/20;该发明授权一种基于双级搜索MVDR的远场多声源快速定位方法是由朱建良;张拓;薄煜明;王军;吴盘龙;刘宗凯;张贤椿;王超尘设计研发完成,并于2024-04-24向国家知识产权局提交的专利申请。

一种基于双级搜索MVDR的远场多声源快速定位方法在说明书摘要公布了:本发明公开了一种基于双级搜索MVDR的远场多声源快速定位方法,该方法为:使用声源识别定位系统获取单声道音频数据,并对单声道音频数据进行低通滤波;对单声道音频数据进行静态MFCC特征提取和过零点特征提取,并对两种特征进行融合;预训练基于BP网络的分类矩阵组,将融合特征送入训练好的基于BP网络的分类矩阵组进行识别,将音频数据FFT结果和预置声源类别对应频率区间进行对比,确定用于MVDR计算的频率;使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索MVDR快速算法,实现俯仰角、方位角估计。本发明可以进行多声源的快速识别和定位,具有精确度高、计算量低、工作稳定、可靠性高的优点。

本发明授权一种基于双级搜索MVDR的远场多声源快速定位方法在权利要求书中公布了:1.一种基于双级搜索MVDR的远场多声源快速定位方法,其特征在于,包括以下步骤:步骤1、使用声源识别定位系统获取单声道音频数据,使用短时傅里叶变换对单声道音频数据进行低通滤波;步骤2、对单声道音频数据进行静态MFCC特征提取、一阶差分MFCC特征提取和过零点特征提取,并对两种特征进行融合;步骤3、预训练基于BP网络的分类矩阵组,将融合特征送入训练好的基于BP网络的分类矩阵组,输出声源类别,将音频数据FFT结果和预置声源类别对应频率区间进行对比,确定用于MVDR计算的频率;步骤4、使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索MVDR快速算法,实现俯仰角、方位角估计;步骤2中,对单声道音频数据进行静态MFCC特征提取、一阶差分MFCC特征提取和过零点特征提取,并对两种特征进行融合,具体如下:步骤2.1、对滤波后的单声道音频数据进行MFCC特征提取和一阶差分MFCC特征提取,具体如下:步骤2.1.1、将线性频率f转换为梅尔频率fmel,公式为: 步骤2.1.2、将声源频率范围fl,fh依据式2转换为fl-mel,fh-mel,fl-mel,fh-mel分别表示梅尔频率的最小值和最大值,设定所需MFCC维数为梅尔滤波器个数为M,则梅尔尺度下的第m个滤波器的中心点频率fmelm为: 步骤2.1.3、将各梅尔滤波器的梅尔中心频率转换回线性频率,公式为: 其中f为实际频率,单位为Hz;步骤2.1.4、生成梅尔滤波器组,公式为: 其中,Hmk为梅尔滤波器函数,fm,1≤m≤M表示第m个梅尔滤波器的中心频率,每个中心频率在Mel域等间隔分布,在实际频率域不等间隔分布;步骤2.1.5、对梅尔滤波器组的输出取对数,公式为: 其中,Xk为线性频谱,sm为对数频谱,K为FFT点数;步骤2.1.6、将对数输出进行DCT变换,得到静态MFCC系数,公式为: 其中,cγ是第γ个离散余弦变换系数,即静态MFCC系数,γ是DCT系数的索引,取0到步骤2.1.7、使用静态MFCC系数生成一阶差分MFCC系数,公式为:ΔMFCCdt=MFCCdt-MFCCdt-18其中,ΔMFCCdt是t时刻的第d个MFCC系数的一阶差分,MFCCdt是当前时刻第d个MFCC系数,MFCCdt-1是前一时刻的MFCC系数,第一帧的差分系数为每帧最后一个MFCC因数和第一个MFCC因数的差值;步骤2.2、对滤波后的单声道音频数据进行过零点特征提取,具体如下:步骤2.2.1、计算单声道音频数据的短时过零率ZCR,公式为: 在当前帧内,采集信号总点数为N,信号表示为sn,n∈[1,N],n为整数,sgnx是符号函数;步骤2.2.2、计算单声道音频数据的过零点序列z[n],公式为: 步骤2.2.3、计算单声道音频数据的过零间隔长度序列ZCIS,对于每一对连续过零点z[ni]和z[ni+1],间隔长度Ii为两过零点之间的采样点数:Ii=ni+1-ni11其中ni表示过零点序列中第i个为1的值对应的信号采样点数;步骤2.2.4、对各种目标信号进行过零点特征分析,得到和背景噪声不同的ZCIS;步骤2.3、将对单声道音频数据的静态MFCC特征和过零点特征进行融合;步骤3所述的预训练基于BP网络的分类矩阵组,将融合特征送入训练好的基于BP网络的分类矩阵组,输出声源类别,将音频数据FFT结果和预置声源类别对应频率区间进行对比,确定用于MVDR计算的频率,具体如下:步骤3.1、预训练基于BP网络的分类矩阵组,具体如下:步骤3.1.1、配置BP网络参数:单声道音频数据的静态MFCC和过零点融合特征包括12阶静态MFCC特征、12阶一阶差分MFCC特征、1阶ZCR特征、4阶ZCIS特征,因此配置输入层神经元数p为29层,根据声源类别数配置输出层神经元数量q,并根据输入层神经元数p和输出层神经元数量q配置隐藏层神经元数h,公式为: 其中a为1~10之间调节的调节函数;步骤3.1.2、生成权重矩阵、偏置矩阵:生成输入层到隐藏层的权重矩阵W1和偏置矩阵b1,维度分别为p×h和h×1;生成隐藏层到输出层的权重矩阵W2和偏置矩阵b2,维度分别为h×q和q×1;步骤3.2、将融合特征送入训练好的基于BP网络的分类矩阵组,输出声源类别,具体如下:设定输入信号的融合特征为矩阵x,识别结果为矩阵Y,则有: 其中函数f是Softmax激活函数,定义如下: 步骤3.3、将音频数据FFT结果和预置声源类别对应频率区间进行对比,确定用于MVDR计算的频率,具体如下:对每种声源类别预置一个频率区间,将音频数据FFT的最大频率分量和对应类别的频率区间对比,如果该频率落在区间内,则使用其进行定向解算;若不在区间内,则对比次大频率分量,直到有S个频率落在区间内,S为声源个数;步骤4所述的使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索MVDR快速算法,实现俯仰角、方位角定向,具体如下:步骤4.1、使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算协方差矩阵,具体如下: 其中矩阵R为有限快拍数下协方差矩阵,维数为6×6,L为快拍数,矩阵Xl为各阵元的采样信号,维数为6×1;步骤4.2、执行初级搜索:将初级搜索方位角的搜索步长θI设为2.5°,俯仰角的搜索步长设为5°,在θI∈[0,π],范围内计算MVDR功率并找到峰值点公式为: 其中为六元均匀圆阵列的阵列流形矩阵,设定存在S个声源,则其中第s个声源的导向矢量为: 其中λ为该声源的波长;步骤4.3、执行次级搜索:将次级搜索的方位角搜索步长、俯仰角搜索步长θII和设为0.5°,在θ∈[θC-θI,θC+θI],范围内计算MVDR功率并找到峰值点

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。