首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种高效自适应面向语音识别引擎的热词纠错方法与系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明提供了一种高效自适应面向语音识别引擎的热词纠错方法与系统,所述系统包括数据采集与分类模块、自适应数据扩增模块、热词纠错训练模块和热词纠错推理模块,数据采集与分类模块对实际应用中出现的误识别情况进行大规模的数据收集,并对收集的数据进行分类,自适应数据扩增模块针对特定的语音识别引擎,采集和增加热词相关的错误实例,构建用于热词纠错模型训练的训练数据集;热词纠错训练模块使用深度学习算法,构建一个针对语音识别引擎热词错误的纠错模型;热词纠错推理模块用于对语音识别引擎输出的文本信息进行错误检测和修正,并输出矫正正确的文本信息。通过本发明方案,提高了模型在热词纠错方面的整体性能和准确性。

主权项:1.一种高效自适应面向语音识别引擎的热词纠错系统,其特征在于,所述系统包括数据采集与分类模块、自适应数据扩增模块、热词纠错训练模块和热词纠错推理模块;数据采集与分类模块对实际应用中出现的误识别情况进行大规模的数据收集,并对收集的数据进行分类,将数据划分为热数据、温数据和冷数据,热数据是指当前或近期具有极高使用频率和即时影响力的词汇集合,温数据是指在短期内使用频率相对较低但仍然具有一定活跃度的词汇,冷数据是指长期观察下使用频率持续低迷的词汇库;自适应数据扩增模块针对特定的语音识别引擎,系统性地采集和增加热词相关的错误实例,构建用于热词纠错模型训练的训练数据集,所述自适应数据扩增模块包括文本预处理单元、语音合成单元、语音识别引擎、文本记忆单元、错误数据标注单元和训练数据生成单元;文本预处理单元对原始输入文本执行前期预处理操作,包括去除重复数据和进行脱敏处理,并规范化文本格式,经过预处理后的文本数据被分别输送至语音合成单元和错误数据标注单元;语音合成单元根据语音识别引擎的特点,将预处理过的热数据转换为对应的语音数据,生成的语音数据作为语音识别引擎的输入数据;语音识别引擎识别所述语音数据并转化为文本形式,通过分析其识别过程中的误差特性,有针对性地收集热词出现错误的具体案例;文本记忆单元用于存储语音识别引擎在处理过程中产生的错误文本输出,这些错误信息会被及时传递给后续的错误数据标注单元;错误数据标注单元将接收到的文本记忆单元提供的错误信息与经过预处理后的真实文本数据进行对比分析,标识出文本中出现错误的位置,提供精确的标注结果;训练数据生成单元根据真实文本内容,基于语音识别引擎输出的带有错误的文本以及经错误数据标注单元确定的错误位置信息,整合构建用于训练热词纠错模型的训练数据集;热词纠错训练模块使用深度学习算法,构建一个针对语音识别引擎热词错误的热词纠错模型,热词纠错训练模块包括模型参数调整单元、共享编码单元、位置检测单元、文本纠错单元、融合损失单元、训练决策单元和最优模型获取单元;模型参数调整单元获取训练数据生成单元生成的训练数据,并初始化模型参数,随着训练进程的推进,该单元根据融合损失函数动态调整模型参数,不断优化模型性能;共享编码单元通过深度学习算法对文本训练数据进行深入分析并提取关键特征,将这些特征编码为特征向量,然后将这些编码后的信息同时输送至位置检测单元和文本纠错单元;位置检测单元对错误信息的位置进行检测,输出位置信息,为文本纠错单元提供位置信息进行针对性纠错;文本纠错单元对共享编码信息进行学习,根据错误字的位置信息进行纠错;融合损失单元整合位置检测单元和文本纠错单元所产生的损失,形成融合损失函数,综合分析两者与训练数据集中目标标签间的整体差距;训练决策单元基于融合损失函数判断模型预测结果与真实标签之间的误差程度,当误差大于预设阈值时,继续训练并调整相关参数,若误差低于阈值,停止训练;最优模型获取单元在整个训练流程结束后,从迭代过程中选出最优的热词纠错模型,用以校正语音识别引擎产生的文本输出中的错误;热词纠错推理模块用于对语音识别引擎输出的文本信息进行错误检测和修正,当纠正后的文本仍存在误差时,自动将其推送至错误数据标注单元,以深入收集和分析这些错误信息,当纠正后的文本没有误差,则输出矫正正确的文本信息,热词纠错推理模块包括预识别处理单元、热词纠错单元、文本生成单元、决策判断单元和文本输出单元;预识别处理单元对接收到的语音识别引擎输出的文本进行标准化处理,确保输入到热词纠错单元的信息格式规范、一致;热词纠错单元利用训练好的纠错模型对预处理过的文本内容执行细致校正,针对特定场景下的热词及常见误识情况进行针对性纠错;文本生成单元基于纠错的结果生成最终的文本内容;决策判断单元通过将纠错后的文本内容与真实的目标文本进行比较验证,做出决策,若两者间存在差异,则将原始的预识别结果传递给文本记忆单元以备后续分析;若无差异,表示纠错成功,并将矫正正确的文本传递给文本输出单元;文本输出单元将最终确认无误的纠错文本内容对外发布或引用。

全文数据:

权利要求:

百度查询: 电子科技大学 一种高效自适应面向语音识别引擎的热词纠错方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术