买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军海军航空大学
申请日:2024-12-19
公开(公告)日:2025-01-24
公开(公告)号:CN119360836A
专利技术分类:.创建基准模板;训练语音识别系统,例如对说话者声音特征的适应(G10L15/14优先)[2013.01]
专利摘要:本发明公开了一种面向音频的关键语义信息检测方法,属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段,提高了计算效率,并降低了关键词位置对检测效果的影响。
专利权项:1.一种面向音频的关键语义信息检测方法,将待检测音频输入至关键语义信息检测模型中,得到待检测音频中包含关键语义信息的概率,其特征在于:所述关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器;所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中;所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率;对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合;将待检测音频所有帧对应的概率集合中的最大值作为该待检测音频的检测结果;对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标,即对于第个训练样本,其损失函数为: ;其中:,是第个训练样本通过关键语义信息检测模型得到的检测结果,是第个训练样本的帧数,是第个训练样本的第帧对应的概率集合,是预设的最小持续帧数;是第个训练样本的真实标签。
百度查询: 中国人民解放军海军航空大学 一种面向音频的关键语义信息检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。