Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜内蒙古工业大学仁庆道尔吉获国家专利权

恭喜内蒙古工业大学仁庆道尔吉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜内蒙古工业大学申请的专利基于ghost和iLPCnet的蒙古语语音合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114822487B

龙图腾网通过国家知识产权局官网在2025-04-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210252979.6,技术领域涉及:G10L13/02;该发明授权基于ghost和iLPCnet的蒙古语语音合成方法是由仁庆道尔吉;张文静;萨和雅;代钦;锡林格日勒设计研发完成,并于2022-03-15向国家知识产权局提交的专利申请。

基于ghost和iLPCnet的蒙古语语音合成方法在说明书摘要公布了:本发明公开一种基于ghost和iLPCnet的蒙古语语音合成方法,基于Bang预训练模型,对齐蒙古语音素信息序列;基于ghost的声学模型,根据音素序列生成声学特征;以iLPCnet模型为声码器,进行声学特征到语音波形的转换。本发明使用Encoder‑Decoder模型将蒙古语文本转化成音素,其次使用基于ghost的声学模型将音素直接生成mel频谱,iLPCnet声码器直接将mel频谱转化为语音波形,可以无缝地集成到端到端的TTS系统降低了对参数的需求,提高了语音合成的速度,适合于小语种的语音合成。

本发明授权基于ghost和iLPCnet的蒙古语语音合成方法在权利要求书中公布了:1.一种基于ghost和iLPCnet的蒙古语语音合成方法,其特征在于,包括如下步骤:步骤1,提取蒙古文的文本特征,并将文本特征编码转换为音素序列,所述音素序列输入至Bang预训练模型;所述Bang预训练模型由多层堆叠的Transformer编码器和多层堆叠的Transformer解码器组成;所述Transformer编码器使用自注意力机制,所述Transformer解码器使用跨流可见多流自注意力机制;所述跨流可见多流自注意力机制,在第一个预测流中,每个输入的蒙古语音素信息均是有依赖关系的,每个音素均以自回归进行预测;在剩余预测流中,第一个音素以非自回归进行预测,其他音素则以介于自回归和非自回归之间的方式进行预测;目标序列长度|Y|=n,则Bang预训练模型设置n个预测流,此时每个音素的前i个信息被掩码替换的情形,均能够在同一个时间步中被并行预测;步骤2,利用Bang预训练模型训练蒙古文音素信息,将音素信息对齐;步骤3,基于加轻量级ghost模块的deepvoice3声学模型,通过音素信息生成声学特征;步骤4,以融入蒙古语语音特征的iLPCnet模型为声码器,将声学特征转换为语音波形,进而实现蒙古语语音合成。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人内蒙古工业大学,其通讯地址为:010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。