一种自适应语音增强的语音交互方法、系统及存储介质

导航：龙图腾网> 最新专利技术> 一种自适应语音增强的语音交互方法、系统及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请提供了一种自适应语音增强的语音交互方法，该方法包括：获取用户输入的语音文件，并通过语音识别得到相应的文本文件；根据seq2seq端到端模型得到机器回复的文本文件；将机器回复的文本文件进行文本分析，并送入声学模型中进行训练，获取语音特征，通过声码器合成语音；获取伦巴第语音音频的德语语料库作为训练数据集，采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0；通过声压计实时获取当前环境噪声等级；将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试，根据实时噪声等级进行相应的语音风格转换，并输出语音增强后的语音。

主权项：1.一种自适应语音增强的语音交互方法，其特征在于，所述方法包括：获取用户输入的语音文件，并通过语音识别得到相应的文本文件；根据seq2seq端到端模型对所述文本文件进行翻译，以得到机器回复的文本文件，其中，所述seq2seq端到端模型是根据THCHS-30中文数据库训练得到的；将所述机器回复的文本文件进行文本分析，并送入声学模型中进行训练，获取语音特征，通过声码器合成语音；获取包含正常语音音频与两个噪声等级下的伦巴第语音音频的德语语料库作为训练数据集，采用所述训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0；通过声压计实时获取当前环境噪声等级；将所述特征频谱包络MCCs特征和所述当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试，根据实时噪声等级进行相应的语音风格转换，并输出语音增强后的语音，计算自适应自注意StarGAN网络的损失函数；将语音可懂度、短时客观可懂度作为语音增强后的语音的可懂度以及感知效果的评价指标。

全文数据：

权利要求：

百度查询：江汉大学一种自适应语音增强的语音交互方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种日志数据处理方法、装置、电子设备和存储介质

下一篇：一种基于阵列式超声的动弹模量和泊松比的自动检测方法

相关技术

一种日志数据处理方法、装置、电子设备和存储介质

一种基于阵列式超声的动弹模量和泊松比的自动检测方法

柴油发电机并网管控半物理测试系统与方法

线切割机砂浆热交换器更换装置及方法

异构GPU调度方法、装置、存储介质、电子设备及产品

一种用于培养箱的培养基管理提醒装置及系统

一种振动测试装置

一种无线供电压力实时测量的舞蹈鞋及方法、生产方法

一种基于微服务架构的电子学生证与家校互动管理平台

一种车身门槛结构及车身

退役核设施结构安全评估可靠度方法及系统

一种用于电源的不间断快速切换装置及方法

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种自适应语音增强的语音交互方法、系统及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务