首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于人工智能的音频分析降噪方法、系统及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州知聊信息技术有限公司

摘要:本发明公开一种基于人工智能的音频分析降噪方法、系统及存储介质,属音频处理技术领域,所述方法包括:自输入音频频谱中识别显性噪声频谱段及其排布方式,预设音频场景并根据对应的分段采样规则对输入音频分段采样,形成多段子音频并标记各子音频的定位标签;解析各段子音频中所含噪声频谱,调取或新生成滤波模型组成子降噪模型;根据各子音频的定位标签对各子降噪模型进行排列组合,形成主降噪模型对输入音频降噪并输出。通过对音频频谱中的显性噪声频谱及其排布方式加以判断,快速确认音频场景并调取相关音频分段采样规则,由此得到各子音频及其对应的滤波模型或子降噪模型,提升降噪模型生成的速度和准确度,有利于提高音频降噪处理的效率。

主权项:1.一种基于人工智能的音频分析降噪方法,其特征在于,包括:关联存储各类别噪声频谱及其对应的滤波模型;关联存储各音频场景及其对应的各噪声频谱段以及排布方式;关联存储各音频场景中输入音频的分段采样规则;自输入音频频谱中识别显性噪声频谱段及其排布方式,判定各显性噪声类别,预设输入音频所对应的音频场景;根据所述音频场景并按照与之对应的所述分段采样规则对输入音频进行分段采样,形成多段子音频并标记各子音频频谱在音频频谱中的定位标签;解析各段子音频中所含噪声频谱,调取或新生成滤波模型组成子降噪模型;根据各子音频的定位标签对各子降噪模型进行排列组合,形成主降噪模型对输入音频进行降噪并输出;和或基于各子降噪模型对各段子音频进行降噪后,根据各子音频关联的定位标签将降噪后的各纯净音频整合输出;其中,所述自输入音频频谱中识别显性噪声频谱段及其排布方式,包括:获取并解析得到输入音频的时域数据及频域数据并对应生成输入音频的时域图及频域图,于频域图中根据各个频谱段所含能量大小以不同亮度显示频域图中各频谱段能量分布;基于上述频域图建立以时间为横轴、频率为纵轴的二维坐标系;基于图像识别技术识别频域图中各频谱段的能量分布,确认显性噪声所属的频谱段并以此频谱段中频谱识别显性噪声类别,根据上述频谱段在所述二维坐标系中的位置得到各显性噪声频谱段的排布方式;所述分段采样规则,包括:获取各显性噪声频谱在所述二维坐标系中横轴及纵轴的分布区域,以所述分布区域为基准,在所述二维坐标系中横向和纵向各延伸设定长度形成采样区域,生成所述子音频;或获取各显性噪声频谱在所述二维坐标系横轴上的起止时间,以所述起止时间节点作为分段节点,采样形成所述子音频;所述解析各段子音频中所含噪声频谱,调取或新生成滤波模型组成子降噪模型,包括:识别采集各子音频中所含的频谱段,解析各频谱段中所含噪声频谱特征并将其与数据库中存储的各噪声频谱特征做对比:若所述噪声频谱特征为已知,则直接调取对应的滤波模型;若所述噪声频谱特征为未知,则调取至少一个近似频谱的滤波模型,修改所述滤波模型的设定参数生成目标滤波模型;所述基于人工智能的音频分析降噪方法还包括:获取各特定音频场景所对应的历史降噪数据;对比带噪音频频谱与纯净音频频谱之间的差异,获取各显性噪声频谱段及隐性噪声频谱段在音频频谱中的位置坐标;基于上述位置坐标生成并存储在所述特定音频场景中用以表征各显性噪声频谱段与各隐性噪声频谱段相对位置关系的坐标映射函数;获取当前输入音频中各显性噪声频谱段于音频频谱中的位置坐标;基于当前输入音频所对应的音频场景,调取对应的坐标映射函数,估算各隐性噪声频谱段于音频频谱中的位置坐标;基于各显性噪声频谱段及估算的各隐性噪声频谱段位置坐标,生成降噪模型对输入语音进行降噪处理。

全文数据:

权利要求:

百度查询: 杭州知聊信息技术有限公司 基于人工智能的音频分析降噪方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。