买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海喜马拉雅科技有限公司
摘要:本发明涉及音频处理技术领域,提供一种背景音乐音量调节方法、装置、电子设备及存储介质。通过获取当前播放的原始音频,原始音频包括人声和背景音乐;并基于用户的音量调节操作,获得信噪比参数,该信噪比参数表示人声和背景音乐的能量比值;然后利用预设模型对原始音频中的人声进行估计得到估计结果,并基于估计结果获得人声音频;再利用线性滤波器基于人声音频对原始音频进行滤波,得到背景音乐音频;最后按照信噪比参数对人声音频和背景音乐音频进行混合,以调节背景音乐的音量。通过采用模型和滤波器提升了人声和背景音乐分离的效果,同时保证了音量调节的实时性,提升了用户体验。
主权项:1.一种背景音乐音量调节方法,其特征在于,所述方法包括:获取当前播放的原始音频,所述原始音频包括人声和背景音乐;基于用户的音量调节操作,获得信噪比参数,所述信噪比参数表示人声和背景音乐的能量比值;利用预设模型对所述原始音频中的人声进行估计得到估计结果,并基于所述估计结果获得人声音频;利用线性滤波器基于所述人声音频对所述原始音频进行滤波,得到背景音乐音频;按照所述信噪比参数对所述人声音频和所述背景音乐音频进行混合,以调节所述背景音乐的音量;所述利用预设模型对所述原始音频中的人声进行估计得到估计结果,并基于所述估计结果获得人声音频的步骤,包括:按照时间顺序将所述原始音频划分为多个相同时长的音频片段;对每个所述音频片段进行特征提取,得到每个所述音频片段的特征向量;将每个所述音频片段的特征向量输入所述预设模型,得到表征所述估计结果的目标理想幅度掩蔽参数;其中,所述目标理想幅度掩蔽参数表示所述人声音频的幅度谱与所述原始音频的幅度谱的比值;基于所述原始音频和所述目标理想幅度掩蔽参数,得到所述人声音频;所述对每个所述音频片段进行特征提取,得到每个所述音频片段的特征向量的步骤,包括:将全部音频片段中任意一个音频片段作为待处理音频片段;对所述待处理音频片段进行傅里叶变换,得到全频带能量谱;利用三角滤波器组按照等效矩形带宽尺度将所述全频带能量谱划分为子带能量谱;基于所述子带能量谱计算倒谱系数;计算所述倒谱系数的一阶差分和二阶差分;基于所述一阶差分、所述二阶差分及所述子带能量谱,得到所述待处理音频片段的特征向量;遍历每个所述音频片段,得到每个所述音频片段的特征向量。
全文数据:
权利要求:
百度查询: 上海喜马拉雅科技有限公司 背景音乐音量调节方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。