一种基于增量词图重打分的语音识别方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西安交通大学

摘要：本发明公开了一种基于增量词图重打分的语音识别方法及系统，获取待识别的语音信号并提取声学特征；由训练好的声学模型计算声学特征对应的似然概率；解码器构建对应的解码网络，从解码网络中获取状态级别的词图并通过更新词图确定化得到词级别的词图；对剩余解码网络的状态级别词图进行确定化，并和已得到的词级别词图合并生成一遍解码词图；将一遍解码词图和小语料训练得到的重打分语言模型通过有限状态转录机合并算法得到目标词图；获取目标词图的最优代价路径词图，继而得到对应的词序列，将之作为最终的识别结果。本发明降低了普通解码器解码结束后确定化的计算量，加快解码速度；降低特定场景下语音识别的词错误率提高准确度。

主权项：1.一种基于增量词图重打分的语音识别方法，其特征在于，包括以下步骤：S1、获取待识别的语音信号并通过预处理进行声学特征提取；S2、由训练好的声学模型计算声学特征对应的似然概率；S3、解码器通过维特比算法训练得到的解码图和步骤S2计算得到的声学信息构建对应的解码网络，通过设置阈值剪枝路径约束网格大小，从解码网络中获取状态级别的词图并通过更新词图确定化得到词级别的词图；具体步骤如下：S301、从解码网络的状态序列中获取F的状态级别词图，包括状态编号以及转移边；S302、对F的第一部分进行确定化操作，第一部分的最后一帧是重复确定化状态，为重复确定化状态的转移边添加终止状态即构成了有限状态接收机A；对有限状态接收机A进行确定化得到a，从原图中把输入标签相同的跳转合并，逐步加入初始为空的新图中，具体为：S3021、建立一个新的空图，把原图的初始状态和相应的初始权重加入新图，并新建一个队列，把状态放入队列中；S3022、从队列头部取出一个状态p，遍历状态p引出的所有跳转的输入标签，对每种输入标签x，在新图中加入新状态及对应的跳转，新跳转的输入标签为x，权重是原图中x对应的所有跳转的⊕运算，将原图中的若干跳转合并为一个跳转；S3023、把步骤S3024的新状态加入队列；S3024、回到步骤S3023继续处理队列，直到队列为空，将确定化后的结果称之为a；S303、处理第二部分，第二部分的第一帧为第一部分的最后一帧，即重复确定化状态；取重复确定化状态的最后一个状态做为初始状态构建有限状态接收机B，有限状态接收机B复用有限状态接收机A对重复确定化状态的处理结果；通过状态和弧边标签的映射表找到重复确定化状态的弧边标签；由弧边标签映射到第一部分确定化后重复确定化状态的状态编号；将新的状态编号和重复确定化状态一一对应，依次添加后面帧的状态编号和转移边，得到第二部分有限状态接受机B，对有限状态接收机B进行确定化得到b；S304、将a和b合并在一起构成有限状态接收机C，有限状态接收机C中的状态正常情况下由以下两部分组成：a中所有转移边不是弧边标签的状态；b中除了第一个外的所有状态；有限状态接收机C中的弧边包含b中除初始状态出弧的所有弧边，以及a中所有以非重复确定化状态起始和结束的弧边；如果a的初始状态不是重复确定化状态，设为有限状态接收机C的初始状态，否则使用b的初始状态作为所述有限状态接收机C的初始状态；最后通过移除有限状态接收机C中的空标签得到最终结果G，即实现了增量词图生成；S4、解码结束后，对剩余解码网络的状态级别词图进行确定化，并和已得到的词级别词图合并生成一遍解码词图；S5、将一遍解码词图和小语料训练得到的重打分语言模型通过有限状态转录机合并算法得到目标词图；S6、获取目标词图的最优代价路径词图，继而得到该词图最优状态序列对应的词序列，将之作为最终的识别结果。

全文数据：

权利要求：

百度查询：西安交通大学一种基于增量词图重打分的语音识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：芯片内测试电路

下一篇：一种注册终端设备的方法及装置

相关技术

芯片内测试电路

一种注册终端设备的方法及装置

一种组合式固定件依附锁定器

一种组装单元体用稳态调节控制系统

快速滤波器校准方法

一种新型鹅星状病毒疫苗及其制备方法与应用

挖掘装置极限工况的结构优化方法、装置、设备及介质

一种1.0-2.0mm厚度热基镀锌原料的生产方法

一种分层架构下的无人机网络动态任务卸载方法

独立站数据定向同步方法及其装置、设备、介质

图像检测方法、装置、设备、存储介质及程序产品

镭雕装置

打分相关技术

实现资讯高质量打标打分的词群算法以及应用_东方财富信息股份有限公司_202111634777.X

一种拳击比赛打分器_南京星北智能科技有限公司_202323118224.6

书写打分方法、装置、存储介质、电子设备及程序产品_深圳市星桐科技有限公司_202410174055.8

一种基于焓变打分算法和微观动力学引导的催化反应机制提取方法_华东理工大学_202410686128.1

标签打分方法、标签打分模型训练方法和装置_腾讯科技(深圳)有限公司_202410630377.9

机器翻译结果打分方法和装置_北京捷通华声科技股份有限公司_202011395504.X

一种基于增量词图重打分的语音识别方法及系统_西安交通大学_202010588022.X

一种基于共进化信息优化蛋白质-蛋白质对接打分函数的系统和方法_中国科学院深圳先进技术研究院_202410491499.4

一种基于词频打分算法获取法律文书案件地点的方法_深圳市大数据研究院_202111058173.5

基于专家打分的BP神经网络赋权的台区安全性评估方法_国网天津市电力公司_202310794462.4

语音相关技术

语音质量检测模型的训练方法及语音质量的检测方法_北京达佳互联信息技术有限公司_202110202612.9

一种语音处理方法、语音处理装置和可读存储介质_深圳比特微电子科技有限公司_202310313105.1

显示设备及语音播放方法_聚好看科技股份有限公司_202311286289.3

基于情绪的文本到语音_斯纳普公司_202380021010.0

语音理解方法、装置、设备和介质_深圳比特微电子科技有限公司_202310288358.8

一种自然语音翻译系统_广州趣丸网络科技有限公司_202410883467.9

一种多功能语音播报器_北京美科丰业科技有限公司_202420296677.3

语音交互方法、装置、设备及存储介质_岚图汽车科技有限公司_202410860845.1

一种机器人用语音交互装置_北京易和顺智能科技有限公司_202323414764.9

支架、语音支架组件及烹饪器具_珠海格力电器股份有限公司_201910380565.X

重相关技术

切开重睑模尺_成都玛丽亚妇产儿童医院有限公司_202322804096.4

全重定时FFP与半重定时FFP通信方法_成都电科星拓科技有限公司_202410953585.2

一种重杂质去除器_青岛璐璐农业装备有限公司_202420059459.8

一种重包膜裁切装置_天津精华石化有限公司_202323398975.8

选择重传连接的高效重路由_华为技术有限公司_202280090423.X

一种隔热降重的EPP卧铺箱_河北方基恒达汽车部件有限公司_202420276761.9

操纵和检查大且重的部件_贝克休斯控股有限责任公司_202410191658.9

一种耐腐蚀重防腐涂料_狄林新材料(江苏)有限公司_202410956921.9

一种液体肥三重过滤设备_爱尔法农业科技(辽宁)有限公司_202420304876.4

重平衡方法、装置、设备、介质及产品_中移动信息技术有限公司_202410915276.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于增量词图重打分的语音识别方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务