首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于网络收集和语音合成的语音识别方法、系统及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南理工大学

摘要:本发明公开了一种基于网络收集和语音合成的语音识别方法、系统及介质,所述方法包括:选定专业领域;爬取所选定专业领域相关的语料,并进行分句及文本清洗,得到相应的语料库;从开源通用语音库中选取真人录音,生成人声数据库,作为真人声音模板;构建语音合成网络,在语料库基础上使用不同真人声音模板进行自动化批量语音合成,生成专业语音数据集;根据应用场景的需求,构建语音识别神经网络;将开源通用语音库和专业语音数据集进行合并,对语音识别神经网络进行训练和测试,得到增强语音识别模型;利用模型对待识别的语音进行识别。本发明可以提高各个专业领域的语音识别精度,降低语音识别应用成本,为实现智能化的人机交互方式提供新思路。

主权项:1.一种基于网络收集和语音合成的语音识别方法,其特征在于,所述方法包括:选定需构建专业语音识别模型的专业领域;使用主题式网络爬虫爬取所选定专业领域相关的语料,并对爬取到的语料进行分句及文本清洗,得到所选定专业领域的语料库;从开源通用语音库中选取真人录音,生成人声数据库,作为真人声音模板;构建基于深度学习的端到端语音合成网络,在语料库基础上使用不同真人声音模板进行自动化批量语音合成,生成专业语音数据集;根据应用场景的需求,构建语音识别神经网络;将开源通用语音库和专业语音数据集进行合并,对语音识别神经网络进行训练和测试,得到增强语音识别模型;利用增强语音识别模型对待识别的语音进行识别;所述构建基于深度学习的端到端语音合成网络,在语料库基础上使用不同真人声音模板进行自动化批量语音合成,生成专业语音数据集,具体包括:构建基于深度学习的端到端语音合成网络,所述语音合成网络包括编码器、合成器和声码器;利用端到端语音合成网络,编辑程序自动循环执行窗口操作,对语料库逐行进行语音合成操作,得到专业语音数据集,并对语音数据进行质量检验和清洗;其中,所述对语音数据进行质量检验和清洗,具体包括:对语音数据进行识别,并计算输出每条语音的字错率和缺字率,根据具体情况剔除的缺字率和字错率不符合要求的语音文件,从而保证专业语音数据集的质量;所述将开源通用语音库和专业语音数据集进行合并,对语音识别神经网络进行训练和测试,得到增强语音识别模型,具体包括:将开源通用语音库和专业语音数据集进行合并,划分出训练集和测试集;将训练集输入语音识别神经网络进行训练,得到增强语音识别模型;将测试集输入增强语音识别模型进行识别,得到识别准确率;若识别准确率达到预设值,将增强语音识别模型作为最终的增强语音识别模型;若识别准确率未达到预设值,对增强语音识别模型进行调试和优化,直到识别准确率达到预设值,将调试和优化后的增强语音识别模型作为最终的增强语音识别模型。

全文数据:

权利要求:

百度查询: 华南理工大学 基于网络收集和语音合成的语音识别方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。