买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:漳州立达信光电子科技有限公司
摘要:本发明适用于声音识别技术领域,公开了一种婴儿哭声识别方法及终端设备,上述方法包括:获取数字化声音信号;采用定点运算,对数字化声音信号进行特征提取,得到定点数特征向量;对定点数特征向量进行滤波运算,得到浮点数特征向量;将浮点数特征向量输入预先训练完成的声音识别神经网络模型中,识别数字化声音信号是否包含婴儿哭声。本发明可以在保证低运算量的同时提高婴儿哭声识别的准确率。
主权项:1.一种婴儿哭声识别方法,其特征在于,包括:获取数字化声音信号;采用定点运算,对所述数字化声音信号进行特征提取,得到定点数特征向量;对所述定点数特征向量进行滤波运算,得到浮点数特征向量;将所述浮点数特征向量输入预先训练完成的声音识别神经网络模型中,识别所述数字化声音信号是否包含婴儿哭声;所述声音识别神经网络模型包括依次连接的输入层、第一隐藏层、第二隐藏层、第三隐藏层和输出层;所述输入层的维度与所述浮点数特征向量的维度相同;所述第一隐藏层包括64个GRU神经元,所述第二隐藏层包括32个DNN神经元,所述第三隐藏层包含16个DNN神经元;所述输出层包含18个神经元;所述输出层的18个神经元表示18种声音事件类别,所述18种声音事件类别包括婴儿哭声类别;在所述将所述浮点数特征向量输入预先训练完成的声音识别神经网络模型中,识别所述数字化声音信号是否包含婴儿哭声之前,所述婴儿哭声识别方法还包括:获取初始训练集,并对所述初始训练集进行数据增强处理得到目标训练集;所述数据增强的方法包括EMDA及VTLP;对所述目标训练集中的每个训练样本分别进行特征提取,得到每个训练样本对应的浮点数训练特征向量;对每个浮点数训练特征向量分别进行Z-score标准化处理,得到对应的多个标准的训练特征向量;基于所述多个标准的训练特征向量,对预设的声音识别神经网络模型进行训练,得到所述预先训练完成的声音识别神经网络模型。
全文数据:
权利要求:
百度查询: 漳州立达信光电子科技有限公司 婴儿哭声识别方法及终端设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。