基于机器学习的婴幼儿哭声增强方法、装置及设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：宁波星巡智能科技有限公司

摘要：本发明涉及音频处理技术领域，解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰，难以准确区分和提取出有效婴幼儿哭声的问题，提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括：获取第一音频数据，其中，所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据；对所述第一音频数据进行预处理，得到第一音频数据对应的频谱图；将所述频谱图输入自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息；根据所述音频特征信息，对含有婴幼儿哭声的音频数据进行处理，得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声，显著提高了哭声信号的纯净度和识别率。

主权项：1.一种基于机器学习的婴幼儿哭声增强方法，其特征在于，所述方法包括：获取第一音频数据，其中，所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据；对所述第一音频数据进行预处理，得到第一音频数据对应的频谱图；将所述频谱图输入自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息；根据所述音频特征信息，对含有婴幼儿哭声的音频数据进行处理，得到增强后的第二音频数据；其中，所述将所述频谱图输入自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息包括：将所述频谱图进行标准化处理，得到标准化频谱图，其中，所述标准化处理方式采用高斯标准化处理，公式为：，其中，X是频谱图数据，μ是频谱图数据的均值，σ是频谱图数据的标准差,Xnorm是标准化频谱图；构建用于提取婴幼儿哭声特征的自编码器模型，其中，自编码器模型的每层转换的公式为：，其中，hl+1：第l+1层神经元的输出，σ：激活函数，包括sigmoid、ReLU、tanh，W（l）:第l层的权重矩阵，用于计算从第l层到第l+1层的权重，hl：第l层神经元的输出,b（l）：第l层的偏置项，是一个常数；根据所述标准化频谱图输入所述自编码器模型进行训练，得到训练后的自编码器模型，其中，通过反向传播算法训练自编码器模型，反向传播算法的损失函数的表达式为：，其中，Ltotal：总损失函数，是自编码器输出的重构频谱图，为加入到损失函数中的正则化项，公式为：，其中，Wi，j是模型的权重向量，λ是正则化参数，β是KL散度的权重参数,：KL散度，ρ：模型预测的概率分布，：期望概率分布；将所述标准化频谱图输入训练后的自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息；所述根据所述音频特征信息，对含有婴幼儿哭声的音频数据进行处理，得到增强后的第二音频数据包括：根据所述婴幼儿哭声特征，对所述第一音频数据对应的频谱图进行重构，得到第二频谱图，其中，逆高斯标准化公式为：，其中，为第二频谱图，是自编码器输出的重构频谱图，μ是频谱图数据的均值，σ是频谱图数据的标准差；将所述第二频谱图进行转换，得到所述第二频谱图对应的音频数据，其中，使用逆快速傅里叶变换将第二频谱图从频域转换为时域，公式为：，其中，是第二频谱图，是转换回的时域音频信号；IFFT为逆快速傅里叶变换；对所述第二频谱图对应的音频数据进行信号增强处理，得到增强后的第二音频数据。

全文数据：

权利要求：

百度查询：宁波星巡智能科技有限公司基于机器学习的婴幼儿哭声增强方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：数据传输的方法、装置、电子设备和存储介质

下一篇：数据处理方法、装置及电子设备

相关技术

数据传输的方法、装置、电子设备和存储介质

数据处理方法、装置及电子设备

一种铁基层状氧化物钠离子电池正极材料及其制备方法和应用

腔体型电路板及其腔体层

触摸输入装置

具有辅助层的半导体元件及其制备方法

一种快速一步法合成噻二唑-三嗪化合物的方法和应用

页张叠堆检测装置

列车完整性防护方法、装置、线路控制器和存储介质

一种基于近红外光谱三七粉特征提取的质量检测方法

信息推荐方法、装置、设备、存储介质和程序产品

获取剥离预测模型的方法及图形修正的方法

方法相关技术

图像加密方法、解密方法和装置_中移物联网有限公司_202410422319.7

图像加密方法、解密方法和装置_中移物联网有限公司_202410422330.3

显示方法_深圳市风祥水隆电子科技有限公司_202410974799.8

显示方法_精工爱普生株式会社_202210931198.X

问答方法_恒生电子股份有限公司_202411279134.1

显示方法_日东电工株式会社_202380024835.8

编码方法、解码方法、装置、设备及存储介质_中国电信股份有限公司_202311758724.8

通信方法、小区测量的方法与通信装置_华为技术有限公司_201980100706.6

一种火力度标定方法及其加热方法_四川省中药饮片有限责任公司_202410888061.X

帧内滤波预测方法、视频编码方法、视频解码方法及装置_浙江大华技术股份有限公司_202310415904.X

哭声相关技术

基于存算一体架构的哭声检测方法、装置及存储介质_深圳市九天睿芯科技有限公司_202411233857.8

基于婴幼儿哭声检测的视频剪辑方法、装置、设备及介质_宁波星巡智能科技有限公司_202410661120.X

基于机器学习的婴幼儿哭声增强方法、装置及设备_宁波星巡智能科技有限公司_202411080693.X

一种婴儿哭声的检测翻译方法及系统_杭州觅睿科技股份有限公司_202410627276.6

用于识别婴儿哭声的声音分类模型的训练方法及装置_德州学院_202410604236.X

一种婴儿哭声识别护理方法、系统及存储介质_山东第一医科大学附属省立医院(山东省立医院)_202410718059.8

一种用于婴儿啼哭的哭声检测方法、系统及装置_广州番禺职业技术学院_202311002111.1

一种低资源场景下的哭声检测方法、系统_浙江芯劢微电子股份有限公司_202410331518.7

一种哭声检测率测试方法及其装置_珠海亿智电子科技有限公司_202410255865.6

一种婴儿哭声识别护理方法、系统及存储介质_山东第一医科大学附属省立医院(山东省立医院)_202410718059.8

增强相关技术

链路恢复过程增强_高通股份有限公司_202080008023.0

增强现实处理装置、基于增强现实的路线引导方法以及电子装置_星克跃尔株式会社_202110902611.5

图像增强模型的训练方法、增强方法、装置、设备及介质_北京字跳网络技术有限公司_202310376549.X

具有增强特性的球囊导管_微仙美国有限公司_202410944096.0

广角增强现实显示器_辉达公司_202380014920.6

文本增强的表情符号图标_索尼集团公司_202380021301.X

实现业务增强的方法和装置_北京京东尚科信息技术有限公司_201810959384.8

用于封装的粘附增强结构_英飞凌科技股份有限公司_201910709904.4

PF和THD增强的PFC电路_上海三思电子工程有限公司_202410886621.8

用于信号增强编码的变换_威诺瓦国际有限公司_201980063323.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于机器学习的婴幼儿哭声增强方法、装置及设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务