Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

应对低信噪比的鸟鸣声识别分类方法、装置及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中南林业科技大学

摘要:本发明公开了一种应对低信噪比的鸟鸣声识别分类方法、装置及存储介质,涉及人工智能。所述方法包括:提取待识别音频的时间序列信号;对所述时间序列信号中的采样点值按时间顺序逐帧对音频帧进行堆叠以得到第一特征矩阵;利用预设检测算法对所述第一特征矩阵进行端点检测,以得到鸟鸣声真实发声区间的第二特征矩阵;对所述鸟鸣声真实发声区间内的采样点值再次按照时间顺序逐帧对音频帧进行堆叠以得到校准后的第三特征矩阵;利用卷积神经网络对所述第三特征矩阵进行特征提取以输入门控循环网络中进行处理得到识别分类结果。利用本发明对鸟鸣声进行分类识别时,语音端点检测的准确率及对鸟鸣声分类准确度均较高。

主权项:1.一种应对低信噪比的鸟鸣声识别分类方法,其特征在于,所述方法包括:提取待识别音频的时间序列信号;对所述时间序列信号中的采样点值按时间顺序逐帧对音频帧进行堆叠以得到第一特征矩阵;利用预设检测算法对所述第一特征矩阵进行端点检测,以得到鸟鸣声真实发声区间的第二特征矩阵;对所述鸟鸣声真实发声区间内的采样点值再次按照时间顺序逐帧对音频帧进行堆叠以得到校准后的第三特征矩阵,其中,所述第二特征矩阵的第一维与所述第三特征矩阵的第一维对齐;利用卷积神经网络对所述第三特征矩阵进行特征提取以输入门控循环网络中进行处理得到识别分类结果;所述利用预设检测算法对所述第一特征矩阵进行端点检测,以得到鸟鸣声真实发声区间的第二特征矩阵包括:采用能量检测算法检测出所述第一特征矩阵中的各个第一发声候选段;以预设规则对各个所述第一发声候选段中相邻的所述第一发声候选段进行合并处理和不合并处理以得到各个第二发声候选段;选择各个所述第二发声候选段中音频帧数最多的所述第二发声候选段作为所述第二特征矩阵的鸟鸣声真实发声区间;所述采用能量检测算法检测出所述第一特征矩阵中的各个第一发声候选段包括:求取所述第一特征矩阵中所有音频帧的能量总和;根据所述能量总和算出音频帧的能量均值;将所述第一特征矩阵中的各音频帧的能量总和与所述能量均值进行一一比较;若当前音频帧的能量总和大于所述能量均值,则判定当前音频帧为鸟鸣发声候选帧;对所有所述鸟鸣发声候选帧进行记录以获得候选帧列表;根据所述第一特征矩阵中的音频帧顺序将所述候选帧列表中连续的音频帧堆叠以得到各个所述第一发声候选段;所述以预设规则对各个所述第一发声候选段中相邻的所述第一发声候选段进行合并处理和不合并处理以得到各个第二发声候选段包括:对所述第一发声候选段进行一级处理以得到一级处理列表,所述一级处理包括,若各个所述第一发声候选段中相邻的所述第一发声候选段之间不连续的音频帧数不超过第一阈值,则合并相应相邻的所述第一发声候选段得到的第一合并发声候选段;否则不合并;所述一级处理列表包括一级处理发声候选段,包括合并得到的所述第一合并发声候选段和不合并的所述第一发声候选段;若所述一级处理发声候选段的数量等于1,则结束处理;若所述一级处理发声候选段的数量大于2,则对所述一级处理发声候选段进行二级处理以得到二级处理列表,所述二级处理包括,获取相邻的所述一级处理发声候选段之间不连续的音频帧数最小值,若所述最小值不超过第二阈值,则合并相应相邻的所述一级处理发声候选段得到的第二合并发声候选段;否则不合并;所述二级处理列表包括二级处理发声候选段,包括合并得到的所述第二合并发声候选段和不合并的所述一级处理发声候选段;其中,所述第二阈值大于所述第一阈值;若所述二级处理发声候选段的数量大于2,则重复所述二级处理;若所述二级处理发声候选段的数量等于1,则结束处理;获取结束处理后所得到的所述一级处理发声候选段或结束处理后所得到的所述二级处理发声候选段作为所述第二发声候选段。

全文数据:

权利要求:

百度查询: 中南林业科技大学 应对低信噪比的鸟鸣声识别分类方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。