首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于增量词图重打分的语音识别方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安交通大学

摘要:本发明公开了一种基于增量词图重打分的语音识别方法及系统,获取待识别的语音信号并提取声学特征;由训练好的声学模型计算声学特征对应的似然概率;解码器构建对应的解码网络,从解码网络中获取状态级别的词图并通过更新词图确定化得到词级别的词图;对剩余解码网络的状态级别词图进行确定化,并和已得到的词级别词图合并生成一遍解码词图;将一遍解码词图和小语料训练得到的重打分语言模型通过有限状态转录机合并算法得到目标词图;获取目标词图的最优代价路径词图,继而得到对应的词序列,将之作为最终的识别结果。本发明降低了普通解码器解码结束后确定化的计算量,加快解码速度;降低特定场景下语音识别的词错误率提高准确度。

主权项:1.一种基于增量词图重打分的语音识别方法,其特征在于,包括以下步骤:S1、获取待识别的语音信号并通过预处理进行声学特征提取;S2、由训练好的声学模型计算声学特征对应的似然概率;S3、解码器通过维特比算法训练得到的解码图和步骤S2计算得到的声学信息构建对应的解码网络,通过设置阈值剪枝路径约束网格大小,从解码网络中获取状态级别的词图并通过更新词图确定化得到词级别的词图;具体步骤如下:S301、从解码网络的状态序列中获取F的状态级别词图,包括状态编号以及转移边;S302、对F的第一部分进行确定化操作,第一部分的最后一帧是重复确定化状态,为重复确定化状态的转移边添加终止状态即构成了有限状态接收机A;对有限状态接收机A进行确定化得到a,从原图中把输入标签相同的跳转合并,逐步加入初始为空的新图中,具体为:S3021、建立一个新的空图,把原图的初始状态和相应的初始权重加入新图,并新建一个队列,把状态放入队列中;S3022、从队列头部取出一个状态p,遍历状态p引出的所有跳转的输入标签,对每种输入标签x,在新图中加入新状态及对应的跳转,新跳转的输入标签为x,权重是原图中x对应的所有跳转的⊕运算,将原图中的若干跳转合并为一个跳转;S3023、把步骤S3024的新状态加入队列;S3024、回到步骤S3023继续处理队列,直到队列为空,将确定化后的结果称之为a;S303、处理第二部分,第二部分的第一帧为第一部分的最后一帧,即重复确定化状态;取重复确定化状态的最后一个状态做为初始状态构建有限状态接收机B,有限状态接收机B复用有限状态接收机A对重复确定化状态的处理结果;通过状态和弧边标签的映射表找到重复确定化状态的弧边标签;由弧边标签映射到第一部分确定化后重复确定化状态的状态编号;将新的状态编号和重复确定化状态一一对应,依次添加后面帧的状态编号和转移边,得到第二部分有限状态接受机B,对有限状态接收机B进行确定化得到b;S304、将a和b合并在一起构成有限状态接收机C,有限状态接收机C中的状态正常情况下由以下两部分组成:a中所有转移边不是弧边标签的状态;b中除了第一个外的所有状态;有限状态接收机C中的弧边包含b中除初始状态出弧的所有弧边,以及a中所有以非重复确定化状态起始和结束的弧边;如果a的初始状态不是重复确定化状态,设为有限状态接收机C的初始状态,否则使用b的初始状态作为所述有限状态接收机C的初始状态;最后通过移除有限状态接收机C中的空标签得到最终结果G,即实现了增量词图生成;S4、解码结束后,对剩余解码网络的状态级别词图进行确定化,并和已得到的词级别词图合并生成一遍解码词图;S5、将一遍解码词图和小语料训练得到的重打分语言模型通过有限状态转录机合并算法得到目标词图;S6、获取目标词图的最优代价路径词图,继而得到该词图最优状态序列对应的词序列,将之作为最终的识别结果。

全文数据:

权利要求:

百度查询: 西安交通大学 一种基于增量词图重打分的语音识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。