一种基于深度学习的语音识别和人机交互系统及方法

导航：龙图腾网> 最新专利技术> 一种基于深度学习的语音识别和人机交互系统及方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及语音识别的技术领域，公开了一种基于深度学习的语音识别和人机交互系统及方法。本发明首先获取初始语音信号，对初始语音信号进行预处理，得到处理后的语音信号；其次根据处理后的语音信号得到时域信号，根据时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合，组成梅尔倒谱系数特征集合；再训练CNN神经网络和RNN神经网络分别得到声学模型和语言模型，对语音进行识别；根据语音识别结果生成初始语音识别文本，对初始语音识别文本进行预处理和词向量转换，计算相似度，最后根据相似度输出回复文本，实现人机交互。本发明通过对语音信号进行处理达到语音识别和人机交互目的，方法客观且准确。

主权项：1.一种基于深度学习的语音识别和人机交互方法，其特征在于，包括如下步骤：S1、获取语音音频，生成初始语音信号，对所述初始语音信号分别进行语音信号预加重、语音信号分帧加窗、语音信号降噪和端点检测处理后，得到处理后的语音信号；S2、对所述处理后的语音信号进行短时傅里叶变换，得到时域信号，基于时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合，结合帧的能量集合、梅尔倒谱系数集合和二阶差分集合组成梅尔倒谱系数特征集合；S3、训练CNN神经网络和RNN神经网络，分别得到CNN神经网络模型和RNN神经网络模型，将CNN神经网络模型作为声学模型，将RNN神经网络模型作为语言模型，所述梅尔倒谱系数特征集合基于声学模型和语言模型进行语音识别，得到语音识别结果；S4、根据所述语音识别结果生成初始语音识别文本，对初始语音识别文本进行预处理和词向量转换，得到语音识别词向量，根据语音识别词向量计算相似度，通过比较相似度输出回复文本，实现人机交互。

全文数据：

权利要求：

百度查询：北京创世漫道科技有限公司一种基于深度学习的语音识别和人机交互系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于工业视觉监测的配矿原料定量添加装置

下一篇：货厢和车辆

相关技术

一种基于工业视觉监测的配矿原料定量添加装置

货厢和车辆

一种倾斜折板精馏柱

一种高产荆芥内酯重组酿酒酵母工程菌及其优化方法与应用

动压气体箔片轴承和旋转机械

扇出型封装结构和扇出型封装结构的制备方法

一种炒茶控制设备

摄像模组和电子设备

一种下肢康复智能训练仪

一种直流充电桩低压注入绝缘检测电路及其检测方法

一种水性环保防腐涂料制备装置及方法

装修用装饰面板

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度学习的语音识别和人机交互系统及方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务