Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京宇信科技集团股份有限公司王若曦获国家专利权

恭喜北京宇信科技集团股份有限公司王若曦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京宇信科技集团股份有限公司申请的专利一种语音识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785774B

龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510271777.X,技术领域涉及:G10L15/06;该发明授权一种语音识别方法及系统是由王若曦;周继敏设计研发完成,并于2025-03-10向国家知识产权局提交的专利申请。

一种语音识别方法及系统在说明书摘要公布了:本发明实施例提供一种语音识别方法及系统,属于语音识别领域,该方法包括:通过待训练的特征提取模块自所述预处理样本语音内分别提取得到对应的样本语音特征向量,通过待训练的语音模块自所述样本语音特征向量内提取出特征表示和语音的时序依赖关系;将所述映射表示和所述语音的时序依赖关系输入待训练的语言模块,形成多个概率因素序列;针对每个概率因素序列将匹配程度最高的概率因素序列作为所述样本语音信号的语言文本并输出,直至输出的语言文本与样本语音信号对应的标记文本相符合,得到训练完毕的语音识别模型,所述语音识别模型用于接收待识别语音信号并输出对应的语言文本,提高语音识别精度和泛化能力。

本发明授权一种语音识别方法及系统在权利要求书中公布了:1.一种语音识别方法,其特征在于,包括:步骤11、针对每条预处理样本语音,通过待训练的特征提取模块自所述预处理样本语音内分别提取得到对应的样本语音特征向量,所述样本语音特征向量内保留语音生成者的语音特征,所述样本语音特征向量包括语音的频谱特征、语音的时序信息和语音的上下文联系;步骤12、通过待训练的语音模块自所述样本语音特征向量内提取出特征表示和语音的时序依赖关系,所述特征表示包括语音的梅尔倒谱系数、语音的时序特征;根据所述特征表示将语音的频谱特征按顺序映射到对应的音素标签或单词标签上,得到映射表示;步骤13、将所述映射表示和所述语音的时序依赖关系输入待训练的语言模块,通过待训练的语言模块根据所述语音的时序依赖关系,将音素或单词按照语法规则和语义关系进行组合和排序,形成多个概率因素序列;步骤14、将所述语音的时序依赖关系和多个所述概率因素序列输入待训练的解码模块,针对每个概率因素序列,通过待训练的解码模块内的动态规划算法根据所述语音的时序依赖关系判断所述概率因素序列与样本语音信号的匹配程度,将匹配程度最高的概率因素序列作为所述样本语音信号的语言文本并输出;所述样本语音信号为所述预处理样本语音的原始语音;所述样本语音信号指语音生成者采用能够表达含义的任一语言产生的语音流;步骤15、根据输出的语言文本与所述样本语音信号的匹配度,调整步骤11到步骤14的每个步骤中的模块的参数,采用预处理样本语音继续进行训练,直至输出的语言文本与样本语音信号对应的标记文本相符合,得到训练完毕的语音识别模型;所述语音识别模型用于接收待识别语音信号并输出对应的语言文本。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京宇信科技集团股份有限公司,其通讯地址为:102627 北京市大兴区经济开发区科苑路18号院3幢二层R2223室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。