首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于3D卷积的生态环境鸟类鸣声识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:百鸟数据科技(北京)有限责任公司

摘要:本申请涉及语音处理技术领域,具体涉及一种基于3D卷积的生态环境鸟类鸣声识别方法,包括:采集自然环境音频数据,获取有效音频信号,划分滑动窗口,获取每个滑动窗口的信号周期,计算振幅变异因子以及音频结构单调因子,获取鸟鸣置信系数,构建鸟鸣增强信号,计算频域受扰因子以及鸟鸣信号差异因子,获取鸟鸣受扰系数,根据鸟鸣受扰系数以及鸟鸣增强信号中的有效音频信号确定平滑系数,获取鸟类鸣声识别结果。本申请旨在解决传统的维纳滤波算法未考虑到自然环境中音频信号的复杂性导致难以在保留鸟类鸣声细节信息的同时兼顾对自然环境中音频信号的去噪效果的问题。

主权项:1.一种基于3D卷积的生态环境鸟类鸣声识别方法,其特征在于,该方法包括以下步骤:S1,采集自然环境音频数据,获取有效音频信号;S2.1,根据有效音频信号划分滑动窗口,获取每个滑动窗口的信号周期;基于每个滑动窗口中所有信号周期的有效音频信号的复杂程度以及相似程度获取鸟鸣置信系数;S2.2,根据所有滑动窗口的鸟鸣置信系数构建鸟鸣增强信号;基于鸟鸣增强信号中每个信号周期内以及所有信号周期之间有效音频信号的特征差异获取鸟鸣受扰系数;S3,根据鸟鸣受扰系数以及鸟鸣增强信号中的有效音频信号确定平滑系数,获取鸟类鸣声识别结果;所述获取鸟鸣置信系数,包括的具体方法为:基于每个滑动窗口中所有信号周期的有效音频信号的复杂程度获取振幅变异因子以及音频过零复杂指数;基于每个滑动窗口中所有信号周期的有效音频信号的相似程度获取音频结构单调因子;将每个滑动窗口的音频过零复杂指数与音频结构单调因子的比值作为音频复杂系数,将每个滑动窗口中所有信号周期的振幅变异因子之和作为窗内振幅变异系数,将音频复杂系数于窗内振幅变异系数的乘积的归一化值记为鸟鸣置信系数;所述获取鸟鸣受扰系数,包括:对鸟鸣增强信号中每个信号周期内的有效音频信号进行傅里叶变换,输出每个信号周期的鸟鸣频谱图;将鸟鸣频谱图中每个信号包络内的有效音频信号的最大值记为每个信号包络的能量特征值,计算每个信号周期的鸟鸣频谱图中每个信号包络的3db带宽;根据每个信号周期的鸟鸣频谱图中所有信号包络的能量特征值以及3db带宽获取频域受扰因子;根据鸟鸣增强信号中所有信号周期的有效音频信号以及鸟鸣频谱图中每个信号包络的能量特征值获取鸟鸣信号差异因子;计算鸟鸣增强信号中所有信号周期的频域受扰因子的累加和与所有信号周期的鸟鸣信号差异因子的累加和之间的乘积的归一化值作为鸟鸣受扰系数;所述确定平滑系数,获取鸟类鸣声识别结果,包括的具体方法为:将数值0.5与鸟鸣受扰系数之和乘以预设原始平滑系数作为改进后的维纳滤波算法中的平滑系数,采用改进后的维纳滤波算法对鸟鸣增强信号进行去噪,得到鸟类鸣声净化信号,对鸟类鸣声净化信号进行分帧,对每一帧鸟类鸣声净化信号进行傅里叶变换,输出鸟鸣净化频谱图;将所有帧的鸟鸣净化频谱图按照时间顺序组成3维特征图并将其作为DNN深度神经网络中全连接层的输入,输出鸟类鸣声识别结果。

全文数据:

权利要求:

百度查询: 百鸟数据科技(北京)有限责任公司 一种基于3D卷积的生态环境鸟类鸣声识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。