首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于知识图谱和语音特征融合网络的语音理解方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:贵州大学

摘要:本发明公开了一种基于知识图谱和语音特征融合网络的语音理解方法,属于语音识别纠错领域,为了更有效识别,将语音增强网络、语音特征融合网络和语音识别网络进行级联结合,在后续的纠错过程中,引入了基于知识图谱的发散感知纠错方法,知识图谱中的实体被关系连接起来,最后级联一个基于MacBERT的端到端纠错模型作第二重纠错处理,这样基于领域知识图谱的纠错方法更容易检测到专业领域的字词错误并将其修正,而且这种基于知识图谱强语义信息的纠错方式可靠性更高;本发明采用上述方法,降低语音背景噪声的影响,降低语音理解系统的字符错误率,并能针对特定领域,构建相应的知识图谱,使用基于知识图谱的方法进行可靠性更高的纠错。

主权项:1.一种基于知识图谱和语音特征融合网络的语音理解方法,其特征在于:包括以下步骤:S1:获取大型语音数据集,并自行录制领域对话语音数据集,对大型语音数据集和领域对话语音数据集中的每条语音都与噪声混叠来生成嘈杂语音数据集;S2:依据领域对话语音数据集,查阅相关资料并构建对应领域的知识图谱;S3:构建提取语音Fbank特征的Fbank特征提取网络,选择能进行复值操作的深度复卷积递归网络DCCRN,作为复值域的语音增强网络;构建自适应性的语音特征融合网络;使用E-Branchformer作为编码器,Transformer作为解码器,构建端到端的语音识别网络;S4:使用步骤S1中的嘈杂语音数据集来同时训练语音增强网络、自适应性的语音增强融合网络和语音识别网络,将训练好的语音增强网络、自适应性的语音增强融合网络和语音识别网络进行级联,组成声学模型;S5:对声学模型进行优化,直到符合标准;S6:使用步骤S5中的声学模型,输入待识别的语音,进行语音的识别,输出字符序列的句子;S7:使用步骤S2中的知识图谱对声学模型输出的字符序列的句子进行一次纠错,得到一次纠错结果;S8:使用基于MacBERT的端到端纠错模型,对步骤S6中的一次纠错结果再进行纠错,在不改动一次纠错修改内容的前提下,得到二次纠错结果,二次纠错结果为最终的识别结果。

全文数据:

权利要求:

百度查询: 贵州大学 一种基于知识图谱和语音特征融合网络的语音理解方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。