买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京安锐卓越信息技术股份有限公司
摘要:本发明公开了一种方言语音的文字转换方法、装置及介质。其中,方法包括:收集不同地区的方言语音数据,其中方言语音数据包括方言的发音、语速以及语调;采用Mel频率倒谱系数算法、长时平均短时能量比算法以及语音端点检测算法对方言语音数据进行语音特征提取,获取方言语音数据的多种特征音频数据;根据多种特征音频数据以及方言语音数据的文本标注对机器学习模型进行训练,生成方言语音转换模型;将待转换方言语音数据的多种待转换特征音频数据输入至方言语音转换模型,输出待转换方言语音数据的方言转换文本。
主权项:1.一种方言语音的文字转换方法,其特征在于,包括:收集不同地区的方言语音数据,其中所述方言语音数据包括方言的发音、语速以及语调;采用Mel频率倒谱系数算法、长时平均短时能量比算法以及语音端点检测算法对所述方言语音数据进行语音特征提取,获取所述方言语音数据的多种特征音频数据;根据多种所述特征音频数据以及所述方言语音数据的文本标注对机器学习模型进行训练,生成方言语音转换模型;将待转换方言语音数据的多种待转换特征音频数据输入至所述方言语音转换模型,输出所述待转换方言语音数据的方言转换文本,其中,所述Mel频率倒谱系数算法的加窗公式为: ;式中,a为汉明加窗函数的系数,n为分帧的长度,N为窗长。
全文数据:
权利要求:
百度查询: 北京安锐卓越信息技术股份有限公司 一种方言语音的文字转换方法、装置及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。