Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习的语音识别和人机交互系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明涉及语音识别的技术领域,公开了一种基于深度学习的语音识别和人机交互系统及方法。本发明首先获取初始语音信号,对初始语音信号进行预处理,得到处理后的语音信号;其次根据处理后的语音信号得到时域信号,根据时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合,组成梅尔倒谱系数特征集合;再训练CNN神经网络和RNN神经网络分别得到声学模型和语言模型,对语音进行识别;根据语音识别结果生成初始语音识别文本,对初始语音识别文本进行预处理和词向量转换,计算相似度,最后根据相似度输出回复文本,实现人机交互。本发明通过对语音信号进行处理达到语音识别和人机交互目的,方法客观且准确。

主权项:1.一种基于深度学习的语音识别和人机交互方法,其特征在于,包括如下步骤:S1、获取语音音频,生成初始语音信号,对所述初始语音信号分别进行语音信号预加重、语音信号分帧加窗、语音信号降噪和端点检测处理后,得到处理后的语音信号;S2、对所述处理后的语音信号进行短时傅里叶变换,得到时域信号,基于时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合,结合帧的能量集合、梅尔倒谱系数集合和二阶差分集合组成梅尔倒谱系数特征集合;S3、训练CNN神经网络和RNN神经网络,分别得到CNN神经网络模型和RNN神经网络模型,将CNN神经网络模型作为声学模型,将RNN神经网络模型作为语言模型,所述梅尔倒谱系数特征集合基于声学模型和语言模型进行语音识别,得到语音识别结果;S4、根据所述语音识别结果生成初始语音识别文本,对初始语音识别文本进行预处理和词向量转换,得到语音识别词向量,根据语音识别词向量计算相似度,通过比较相似度输出回复文本,实现人机交互。

全文数据:

权利要求:

百度查询: 北京创世漫道科技有限公司 一种基于深度学习的语音识别和人机交互系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。