Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 科大讯飞股份有限公司蔡沅沅获国家专利权

科大讯飞股份有限公司蔡沅沅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉科大讯飞股份有限公司申请的专利一种词汇拆分模型构建方法、语音识别模型构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114974222B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210493382.0,技术领域涉及:G10L15/06;该发明授权一种词汇拆分模型构建方法、语音识别模型构建方法是由蔡沅沅;张光云;万根顺;高建清;刘聪;胡国平;刘庆峰设计研发完成,并于2022-05-07向国家知识产权局提交的专利申请。

一种词汇拆分模型构建方法、语音识别模型构建方法在说明书摘要公布了:本申请公开了一种词汇拆分模型构建方法、语音识别模型构建方法,本申请先利用大量样本词汇、这些样本词汇的发音描述信息、以及这些样本词汇的拆分标注信息,构建词汇拆分模型,以使构建好的词汇拆分模型能够学习到依据词汇发音进行词汇拆分处理的能力;再利用构建好的词汇拆分模型、以及该目标语种下大量的最小语义单元,构建该目标语种下的子词词典;然后,借助该子词词典,构建该目标语种下的语音识别模型;最后,利用该语音识别模型针对该目标语种下的任意一个语音数据进行语音识别处理,如此有利于提高该目标语种下的语音识别效果。

本发明授权一种词汇拆分模型构建方法、语音识别模型构建方法在权利要求书中公布了:1.一种词汇拆分模型构建方法,其特征在于,所述方法包括: 获取目标语种下的样本词汇、所述样本词汇的发音描述信息和所述样本词汇的拆分标注信息; 利用所述样本词汇、所述样本词汇的发音描述信息和所述样本词汇的拆分标注信息,构建词汇拆分模型;其中,所述词汇拆分模型用于参考所述样本词汇的发音描述信息对所述样本词汇进行词汇拆分处理; 所述词汇拆分模型的构建过程,包括:将所述样本词汇按照所述目标语种下的最小书写单元进行拆分处理,得到所述样本词汇的词汇书写序列;从所述样本词汇的发音描述信息中提取所述样本词汇的词汇音素特征;将所述样本词汇的词汇书写序列和所述样本词汇的词汇音素特征进行集合处理,得到所述样本词汇的词汇描述数据;将所述样本词汇的词汇描述数据输入待训练模型,得到所述待训练模型输出的所述样本词汇的预测拆分结果;根据所述样本词汇的预测拆分结果和所述样本词汇的拆分标注信息,更新所述待训练模型,并继续执行所述将所述样本词汇的词汇描述数据输入待训练模型,得到所述待训练模型输出的所述样本词汇的预测拆分结果的步骤,直至在达到预设停止条件之后,根据所述待训练模型,确定所述词汇拆分模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。