Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 安徽讯飞寰语科技有限公司余红亮获国家专利权

安徽讯飞寰语科技有限公司余红亮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉安徽讯飞寰语科技有限公司申请的专利语音识别及模型训练方法、装置、设备及计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126459B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510625610.9,技术领域涉及:G10L15/06;该发明授权语音识别及模型训练方法、装置、设备及计算机程序产品是由余红亮;姚凯;李威;吴重亮;李永超;吴明辉设计研发完成,并于2025-05-15向国家知识产权局提交的专利申请。

语音识别及模型训练方法、装置、设备及计算机程序产品在说明书摘要公布了:本申请公开了一种语音识别及模型训练方法、装置、设备及计算机程序产品,涉及语音识别技术领域,本申请对语音识别模型和文本重建模型联合训练,二者共享同一解码器,文本重建模型还包括基于大语言模型构建的文本编码器,能够对识别文本标签提取文本语义表征,计算音频编码器对音频样本提取的音频语义表征与文本语义表征间的特征对齐损失值,以及计算解码器输出的文本与识别文本标签间的文本识别损失值,大语言模型能够提取丰富的语义信息,通过特征对齐损失值可以将大语言模型丰富的语义信息迁移到音频编码器中,提升语音识别模型在特定领域下的识别效果。推理阶段,将待识别语音信号的声学特征输入语音识别模型,得到模型输出的语音识别结果。

本发明授权语音识别及模型训练方法、装置、设备及计算机程序产品在权利要求书中公布了:1.一种语音识别方法,其特征在于,包括: 获取待识别语音信号的声学特征; 将所述声学特征输入训练后的语音识别模型,得到模型输出的语音识别结果;其中: 所述语音识别模型在训练阶段与文本重建模型联合训练,所述语音识别模型和所述文本重建模型共享同一解码器,所述文本重建模型还包括基于大语言模型构建的文本编码器,联合训练过程以音频样本作为语音识别模型中音频编码器的输入,以所述音频样本对应的识别文本标签作为所述文本编码器的输入,联合训练的总损失值包括基于所述解码器输出的文本与所述识别文本标签计算的文本识别损失值,以及,基于所述音频编码器提取的音频语义表征与所述文本编码器提取的文本语义表征计算的特征对齐损失值,所述特征对齐损失值能够将音频和文本的语义表征统一到同一语义表征空间,将大语言模型丰富的语义信息迁移到音频编码器中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽讯飞寰语科技有限公司,其通讯地址为:230088 安徽省合肥市高新区云飞路66号天源迪科一号楼9楼903;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。