首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种海洋哺乳动物叫声数据增强方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:青岛科技大学

摘要:本发明具体为一种海洋哺乳动物叫声数据增强方法,该方法使用自编码器对海洋哺乳动物叫声数据进行特征提取与降噪重构;将重构后的叫声数据划分为训练集和测试集;搭建生成对抗网络模型,生成对抗网络模型包括生成器和鉴别器,生成器基于GRU网络设计,鉴别器基于轻量化CNN网络设计,生成器将噪声数据转化为生成叫声数据并输入鉴别器,同时将步骤2训练集真实叫声数据输入鉴别器,从而对生成对抗网络模型进行训练;将步骤2测试集输入步骤3训练好的生成对抗网络模型进行验证,最后调用最优的生成对抗网络模型进行数据增强。通过生成器和鉴别器之间的博弈学习来提升模型性能,实现数据增强,增强后的海洋哺乳动物叫声逼真且具有多样性。

主权项:1.一种海洋哺乳动物叫声数据增强方法,其特征在于:所述方法依次包括以下步骤:S1:使用自编码器对海洋哺乳动物叫声数据进行特征提取与降噪重构;S2:将经过自编码器重构后的海洋哺乳动物叫声数据划分为训练集和测试集;S3:搭建生成对抗网络模型,所述生成对抗网络模型包括生成器和鉴别器,所述生成器基于GRU网络设计,所述鉴别器基于轻量化CNN网络设计,所述生成器将噪声数据转化为生成叫声数据并输入鉴别器,同时将步骤2训练集真实叫声数据输入鉴别器,从而对生成对抗网络模型进行训练;S4:将步骤2测试集输入步骤3训练好的生成对抗网络模型进行验证,最后调用最优的生成对抗网络模型进行数据增强;步骤S1所述使用自编码器对海洋哺乳动物叫声数据进行特征提取和降噪重构的方法为:所述自编码器将输入的海洋哺乳动物叫声数据x变换到隐藏变量z,编码过程用公式1表示为:z=fw1x+b11然后通过解码器重构出海洋哺乳动物叫声数据解码过程用公式2表示为: 其中,f为激活函数,x为输入的海洋哺乳动物叫声数据;z为隐藏变量;为重构后的海洋哺乳动物叫声数据;w1、w2为权重矩阵,b1、b2为偏置向量,所述自编码器将输入海洋哺乳动物叫声数据x变换到隐藏变量z,并通过解码器重建出使解码器的输出与原始输入尽可能相似,给定一组数据xn∈RH,1≤n≤N,N是数据样本数量,RH表示H维的特征空间,其重构误差为:最小化重构误差后得有效学习网络参数θ={w1,w2,b1,b2};为了解决所述生成器和鉴别器之间训练不稳定问题,所述生成对抗网络模型采用Wasserstein距离衡量真实叫声数据和生成叫声数据两个分布间的相似程度,Wasserstein距离定义为:WPreal,Pgen=sup||f||≤1Ex~Preal[fwx]-Ex~Pgen[fwx]3式中,E表示期望,Preal表示真实叫声样本的分布,Pgen表示生成叫声样本的分布,sup表示上确界,即最小上界,||f||≤1表示函数是1-Lipschitz函数,将f定义为一个参数化模型后:K×WPreal,Pgen=sup||f||≤KEx~Preal[fwx]-Ex~Pgen[fwx]4式中,K为Lipschitz常数,用于限制鉴别器函数斜率,确保Wasserstein距离的计算有效,W表示真实叫声样本的分布Preal与生成叫声样本的分布Pgen间的距离,fwx表示鉴别器;为了使所述生成对抗网络模型更好的学习音频数据的分布特征,提高训练稳定性,在生成对抗网络的基础上增加梯度惩罚项,表达式如下: 其中,D表示鉴别器,λ表示梯度惩罚的权重系数,X′表示真实叫声数据和生成叫声数据之间的插值,即X′=α*x_real+1-α*x_fake,α表示真实叫声数据和生成叫声数据之间均匀采样的随机数,x_real表示真实叫声数据,x_fake表示生成叫声数据,在训练过程中,惩罚项分别从真实叫声样本和生成叫声样本分布中进行采样,生成对抗网络采用双边惩罚机制,使所有样本的梯度范数都向1靠拢。

全文数据:

权利要求:

百度查询: 青岛科技大学 一种海洋哺乳动物叫声数据增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。