北京云上曲率科技有限公司王旭东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京云上曲率科技有限公司申请的专利一种流式音频语种识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119811383B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411918988.X,技术领域涉及:G10L15/22;该发明授权一种流式音频语种识别方法及系统是由王旭东;周吴;夏朗;杜晓祥设计研发完成,并于2024-12-25向国家知识产权局提交的专利申请。
本一种流式音频语种识别方法及系统在说明书摘要公布了:本发明公开的一种流式音频语种识别方法及系统,属于语种识别技术领域。本发明实现方法为:1、利用语音活性检测方法对原始音频数据进行预处理,得到语种识别训练数据;2、对语种识别训练数据进行特征提取;3、构建编码器解码器模型并进行语种识别特征训练;4、将语种识别测试数据输入至已训练的编码器解码器模型获得语种识别音频数据,将语种识别音频数据以数据累积的方式形成音频数据流;5、利用语音活性检测方法对音频数据流进行活性检测;6、对通过活性检测的音频数据进行窗级别的语种判别;具体的,通过当前窗与上一窗的音频数据对比,进而获得当前状态的时间戳和语种结果;与现有技术相比,本发明在流式场景中实现多语种混合语音识别。
本发明授权一种流式音频语种识别方法及系统在权利要求书中公布了:1.一种流式音频语种识别方法,其特征在于:包括以下步骤, 步骤1:利用语音活性检测方法对原始音频数据进行预处理,得到语种识别训练数据; 步骤2:对语种识别训练数据进行特征提取,进一步的利用傅里叶变换和梅尔滤波器组获得语种识别特征; 步骤3:构建编码器解码器模型并进行语种识别特征训练; 步骤4:将语种识别测试数据输入至已训练的编码器解码器模型获得语种识别音频数据,将语种识别音频数据以数据累积的方式形成音频数据流; 步骤5:利用语音活性检测方法对音频数据流进行活性检测; 步骤6:对通过活性检测的音频数据进行窗级别的语种判别; 步骤6.1:当前窗为起始窗时,返回当前状态的时间戳和语种结果; 步骤6.2:上一窗为静音窗时,返回当前状态的时间戳和语种结果; 步骤6.3:当上一窗不为静音窗且当前窗不为起始窗时,采用当前语种结果与上一时刻语种结果进行对比,进而获得当前状态的时间戳和语种结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京云上曲率科技有限公司,其通讯地址为:100124 北京市朝阳区北苑路186号院2号楼5层501室02;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励