基于网络收集和语音合成的语音识别方法、系统及介质

导航：龙图腾网> 最新专利技术> 基于网络收集和语音合成的语音识别方法、系统及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华南理工大学

摘要：本发明公开了一种基于网络收集和语音合成的语音识别方法、系统及介质，所述方法包括：选定专业领域；爬取所选定专业领域相关的语料，并进行分句及文本清洗，得到相应的语料库；从开源通用语音库中选取真人录音，生成人声数据库，作为真人声音模板；构建语音合成网络，在语料库基础上使用不同真人声音模板进行自动化批量语音合成，生成专业语音数据集；根据应用场景的需求，构建语音识别神经网络；将开源通用语音库和专业语音数据集进行合并，对语音识别神经网络进行训练和测试，得到增强语音识别模型；利用模型对待识别的语音进行识别。本发明可以提高各个专业领域的语音识别精度，降低语音识别应用成本，为实现智能化的人机交互方式提供新思路。

主权项：1.一种基于网络收集和语音合成的语音识别方法，其特征在于，所述方法包括：选定需构建专业语音识别模型的专业领域；使用主题式网络爬虫爬取所选定专业领域相关的语料，并对爬取到的语料进行分句及文本清洗，得到所选定专业领域的语料库；从开源通用语音库中选取真人录音，生成人声数据库，作为真人声音模板；构建基于深度学习的端到端语音合成网络，在语料库基础上使用不同真人声音模板进行自动化批量语音合成，生成专业语音数据集；根据应用场景的需求，构建语音识别神经网络；将开源通用语音库和专业语音数据集进行合并，对语音识别神经网络进行训练和测试，得到增强语音识别模型；利用增强语音识别模型对待识别的语音进行识别；所述构建基于深度学习的端到端语音合成网络，在语料库基础上使用不同真人声音模板进行自动化批量语音合成，生成专业语音数据集，具体包括：构建基于深度学习的端到端语音合成网络，所述语音合成网络包括编码器、合成器和声码器；利用端到端语音合成网络，编辑程序自动循环执行窗口操作，对语料库逐行进行语音合成操作，得到专业语音数据集，并对语音数据进行质量检验和清洗；其中，所述对语音数据进行质量检验和清洗，具体包括：对语音数据进行识别，并计算输出每条语音的字错率和缺字率，根据具体情况剔除的缺字率和字错率不符合要求的语音文件，从而保证专业语音数据集的质量；所述将开源通用语音库和专业语音数据集进行合并，对语音识别神经网络进行训练和测试，得到增强语音识别模型，具体包括：将开源通用语音库和专业语音数据集进行合并，划分出训练集和测试集；将训练集输入语音识别神经网络进行训练，得到增强语音识别模型；将测试集输入增强语音识别模型进行识别，得到识别准确率；若识别准确率达到预设值，将增强语音识别模型作为最终的增强语音识别模型；若识别准确率未达到预设值，对增强语音识别模型进行调试和优化，直到识别准确率达到预设值，将调试和优化后的增强语音识别模型作为最终的增强语音识别模型。

全文数据：

权利要求：

百度查询：华南理工大学基于网络收集和语音合成的语音识别方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：简易式快拆模块化球类器材

下一篇：一种用于基坑地表水降排重力式虹吸装置

相关技术

简易式快拆模块化球类器材

一种用于基坑地表水降排重力式虹吸装置

用于张紧辊或卷绕辊的带轮装置

基于细粒度文本提示特征工程的工业异常检测方法及系统

一种冷库用压力平衡装置

一种基于鸿蒙系统实现对讲模块跨层通信方法及系统

一种项链保护连接结构

一种磷酸铁锂-石墨烯强耦合材料及其制备方法

一种冷轧钢板横向厚度差测量装置

双向直流直流转换电路、车载充电机、系统及交通工具

显示器下方的光学生物特征成像装置中的传感器位移补偿

基于图像分析的城市运行中流动商贩管理方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于网络收集和语音合成的语音识别方法、系统及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务