买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:青海民族大学
摘要:本发明公开一种藏语安多方言语音合成语料库的构建方法及系统,涉及人工智能技术领域,构建方法包括:基于爬虫技术获取多个藏文文本语句;对多个藏文文本进行筛选得到多个藏文语句;对多个藏文语句进行文本归一化处理得到多个藏文文本语料;对多个所述藏文文本语料进行筛选得到多个音素平衡的藏语语音文本;对每一藏语语音文本进行录音得到基础录音;对基础录音进行处理,得到对应的规范语音数据;对规范语音数据进行语料标注得到标注数据;根据每一藏语语音文本对应的藏文文本语句和对应的标注数据构建语料库;语料库用于对待检测的藏文文本语句进行检测,得到对应的标注数据。本发明创建了一种高质量、高自然度及高稳定性的语音合成语料库。
主权项:1.一种藏语安多方言语音合成语料库的构建方法,其特征在于,所述构建方法包括:基于爬虫技术获取多个藏文文本语句;对多个藏文文本语句进行筛选得到多个藏文语句;对多个藏文语句进行文本归一化处理得到多个藏文文本语料;对多个所述藏文文本语料进行筛选得到多个音素平衡的藏语语音文本;针对每一藏语语音文本,对所述藏语语音文本进行录音得到基础录音;所述基础录音为有语言基础的发音人在专业录音棚录制的人声语音;对基础录音进行处理,得到对应的规范语音数据;对所述规范语音数据进行语料标注得到标注数据;根据每一藏语语音文本对应的藏文文本语句和对应的标注数据构建语料库;所述语料库用于对待检测的藏文文本语句进行检测,得到对应的标注数据。
全文数据:
权利要求:
百度查询: 青海民族大学 一种藏语安多方言语音合成语料库的构建方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。