一种通过迁移学习提升重庆方言语音识别的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：重庆大学;重庆医科大学

摘要：本发明公开一种通过迁移学习提升重庆方言语音识别的方法，步骤为：1获取语音数据；2对语音数据进行傅里叶转换，得到语音频谱图；3利用VGG网络对语音频谱图向量化，得到向量V；4获取transformer模型的输入X；5得到参数Q、参数K、参数V；6将参数Q、参数K、参数V输入到transformer模型的编码器encoder1和编码器encoder2中，分别得到编码器输出Y1和编码器输出Y2；7将编码器输出Y1和编码器输出Y2输入到transformer模型的解码器中，得到语音识别文本；8确定拼音BERT模型的输入x；9将输入x输入到拼音BERT模型中，得到语音识别结果。本发明能更全面的捕捉到语义层面信息，并通过pipeline设计模式，将ASR中的声学模型，语言模型独立开，增强了ASR模型选择的多样性。

主权项：1.一种通过迁移学习提升重庆方言语音识别的方法，其特征在于，包括以下步骤：1获取语音数据。2对语音数据进行傅里叶转换，得到语音频谱图。3利用VGG网络对语音频谱图向量化，得到向量v；4获取transformer模型的输入X；所述transformer模型包括编码器encoder1、编码器encoder2和解码器decoder；5对输入X进行转化，得到参数Q、参数K、参数V；6将参数Q、参数K、参数V输入到transformer模型的编码器encoder1和编码器encoder2中，分别得到编码器输出Y1和编码器输出Y2；7将编码器输出Y1和编码器输出Y2输入到transformer模型的解码器中，得到语音识别文本；8基于语音识别文本，确定拼音BERT模型的输入x；9将输入x输入到拼音BERT模型中，得到语音识别结果。

全文数据：

权利要求：

百度查询：重庆大学重庆医科大学一种通过迁移学习提升重庆方言语音识别的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电动汽车无线充电系统漏磁优化方法

下一篇：一种燃料舱搭载精度控制方法和燃料舱

相关技术

一种电动汽车无线充电系统漏磁优化方法

一种燃料舱搭载精度控制方法和燃料舱

基于FPN的复杂环境典型树木高效智能识别方法及系统

基于高强柔性索环连接的混凝土圆形筒状结构与预制筒片

一种汽车减震器的衬套装配装置

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

热回收系统的控制方法、控制装置及计算机可读存储介质

基于比例时滞惯性模糊CG神经网络的保密通信方法

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

一种平开窗

一种基于电子元器件控制的防卡死智能锁体

基于大模型的交互方法、装置、终端设备和存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种通过迁移学习提升重庆方言语音识别的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务