厦门大学洪青阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126451B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510607710.9,技术领域涉及:G10L15/00;该发明授权基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统是由洪青阳;黄胡恺;李琳设计研发完成,并于2025-05-13向国家知识产权局提交的专利申请。
本基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统在说明书摘要公布了:本申请提出一种基于Zip‑MoE模型分组混合专家层的中英文语音识别方法和系统,Zip‑MoE模型包括6个编码器块,每两个编码器块间包含一个Bypass模块,学习前一个编码器块输出和当前编码器块输出加权的权重;前3个编码器块为标准的Zipformer结构;后3个编码器块采用含分组混合专家层的Zipformer‑MoE结构,用分组混合专家层替代Zipformer结构的最后一个前馈网络;分组混合专家层包括中文专家组、英文专家组和语种路由器,专家组均由若干个专家网络构成并分别配置无监督路由器。缓解了语种混淆的问题,能够适配不同时延流式场景,灵活扩展专家数量,无需进行预训练,大大提高了中英文的识别效率。
本发明授权基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统在权利要求书中公布了:1.一种基于Zip-MoE模型分组混合专家层的中英文语音识别系统,其特征在于,包括: 所述Zip-MoE模型包括6个编码器块,每两个编码器块之间包含一个Bypass模块,所述Bypass模块用于学习前一个编码器块输出和当前编码器块输出加权的权重; 其中,前3个编码器块为标准的Zipformer结构; 后3个编码器块采用Zipformer-MoE结构,所述Zipformer-MoE结构包括分组混合专家层,所述分组混合专家层用于替代标准的Zipformer结构的最后一个前馈网络FNN; 所述分组混合专家层包括中文专家组、英文专家组和语种路由器,所述中文专家组和所述英文专家组均由若干个专家网络构成,并分别配置一个独立的无监督路由器; 所述语种路由器设置在所述Zipformer-MoE结构编码器块的下采样操作之后,并通过CTC损失函数对所述语种路由器进行训练得到每帧语音的语种,所述语种路由器的训练公式表示为: ; 其中,表示所述语种路由器的损失函数,表示语种识别的字词级别标签,代表经过下采样后的语音特征,代表语种识别任务的线性分类层权重,D代表嵌入维度,3代表中文语种、英文语种和一个CTC的空白标记; 所述语种路由器基于当前Zipformer-MoE结构编码块的语音特征输出每帧语音的语种分类结果,并基于所述语种分类结果将混合语种表征进行解耦,得到中文表征和英文表征,解耦公式为: ; 其中,表示中文表征,,表示英文表征, 表示混合语种表征,表示语种分类结果,,表示路由到中文专家组的语音帧数,表示路由到英文专家组的语音帧数,T表示语音的总帧数,表示中文掩码矩阵,表示英文掩码矩阵,B表示批处理大小,D表示嵌入维度,表示逐元素乘法,是指示函数,用于获得帧级别的语种掩码矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。