买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:清华大学
申请日:2018-03-21
公开(公告)日:2020-06-02
公开(公告)号:CN108648747B
专利技术分类:.语音识别的特征提取;识别单位的选择[2006.01]
专利摘要:本发明提供了一种语种识别系统,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;通过获取模块获取语种的语音样本,并得到音素序列的概率值和二叉决策树特征超矢量的概率值;再通过超矢量计算模块将音素序列的概率值与二叉决策树特征超矢量的概率值进行比较计算、拼接,从而得到语音样本的联合特征超矢量;分类模块用于将训练库中语种样本的联合特征超矢量进行分类和语种建模,得到每一语种的联合支持矢量,语种识别模块用于获取输入的待测的语音段,在训练库中匹配联合支持矢量,得到与语音段对应的目标语种。本发明能够提高语种识别的准确性。
专利权项:1.一种语种识别系统,其特征在于,所述识别系统包括:获取模块、超矢量计算模块、分类模块及语种识别模块;所述获取模块,用于获取多个语种样本,并计算多个语种样本中每一语音样本的N元文法的特征超矢量的任意一个音素序列的概率值和二叉决策树特征超矢量中相应音素序列的概率值;所述超矢量计算模块,用于根据所述N元文法的特征超矢量的任意一个音素序列的概率值与二叉决策树特征超矢量中相应音素序列的概率值进行比较计算,再将所有音素序列的比较计算结果拼接,得到每一语音样本的联合特征超矢量;所述分类模块,用于根据样本标签将训练库中语种样本的联合特征超矢量通过分类器进行分类和语种建模,获得每一语种的联合支持矢量;所述语种识别模块,用于获取输入的待测的语音段,并计算得到所述语音段的联合特征超矢量;在所述训练库中查询与所述语音段的联合特征超矢量匹配的联合支持矢量;根据匹配结果,获得与所述语音段对应的目标语种。
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。