口音识别声学模型训练、口音识别方法、装置和存储介质专利

发布时间：2024-09-14 01:03:55 来源：龙图腾网导航：龙图腾网> 最新专利技术> 口音识别声学模型训练、口音识别方法、装置和存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：腾讯科技(深圳)有限公司

申请日：2021-01-26

公开（公告）日：2024-09-10

公开（公告）号：CN113593524B

专利技术分类：

专利摘要：本申请涉及一种口音识别声学模型训练方法、装置、计算机设备和存储介质。所述方法包括：获取训练数据；提取训练语音对应的声学特征；将声学特征和口音区域特征输入初始口音识别声学模型中，初始口音识别声学模型将口音区域特征进行变换，得到初始变换特征，对声学特征进行语音特征提取，得到初始语音特征，将初始变换特征和初始语音特征进行合并，得到初始合并特征，并对初始合并特征进行语音音素识别，得到初始语音音素信息；基于初始语音音素信息和对应的音素标签计算损失信息，基于损失信息更新初始口音识别声学模型，并循环迭代执行，直到训练完成时，得到目标口音识别声学模型。采用本方法能够口音识别的准确性。

专利权项：1.一种口音识别声学模型训练方法，其特征在于，所述方法包括：获取训练数据，所述训练数据包括训练语音、所述训练语音对应的口音区域特征和音素标签；提取所述训练语音对应的声学特征；将所述声学特征和所述口音区域特征输入初始口音识别声学模型中，所述初始口音识别声学模型将所述口音区域特征进行变换，得到初始变换特征，对所述声学特征进行语音特征提取，得到初始语音特征，将所述初始变换特征和所述初始语音特征进行合并，得到初始合并特征，并对所述初始合并特征进行语音音素识别，得到初始语音音素信息；基于所述初始语音音素信息和对应的音素标签计算损失信息，基于所述损失信息更新所述初始口音识别声学模型，并返回将所述声学特征和所述口音区域特征输入初始口音识别声学模型中的步骤迭代执行，直到训练完成时，得到目标口音识别声学模型，所述目标口音识别声学模型用于和预设语言模型识别得到待识别语音对应的云端识别结果，同时获取到所述待识别语音的离线识别结果，将所述云端识别结果和所述离线识别结果结合离线和云端语义信息进行融合，得到所述待识别语音对应的识别结果。

百度查询：腾讯科技(深圳)有限公司口音识别声学模型训练、口音识别方法、装置和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

相关链接：龙图腾网专利信息网专利交易龙图腾专利交易网 IPTOP知识产权网

相关技术

种植牙开窗式转移杆

可调回转式校准器

一种多排并管式空调回热器

一种增强抗撞结构的不锈钢防盗门

一种减震效果好的印刷机用立柱

一种高光谱图像分类方法、装置、电子设备和存储介质

目标重识别方法、终端设备及计算机可读存储介质

障碍物识别方法、装置及电子设备

利用污水进行热回收并能防止液击的热泵系统及控制方法

一种湖相页岩压裂液促缝能力的评价方法

一种饼形锻件的焊接预热装置

PICC防水套

识别相关技术

识别媒体、识别媒体的识别方法、识别对象物品以及识别装置_日本发条株式会社_200480032015.0

识别媒体、识别媒体的识别方法、识别对象物品以及识别装置_日本发条株式会社_200480032015.0

使用面部识别识别图像_谷歌公司_200780050762.0

识别仪（动态人脸识别）_广州超越数码科技有限公司_201830634426.1

识别头及识别装置_广州众诺电子技术有限公司_201920122073.6

识别码识别器_深圳市德卡科技股份有限公司_202320994213.5

多识别器语音识别_谷歌有限责任公司_201910931218.1

识别码识别装置_西安奕斯伟材料科技股份有限公司_202322560132.7

识别系统、识别装置、识别方法、识别程序_株式会社电装_202280088767.7

识别系统、识别装置、识别方法、识别程序、识别数据生成方法_株式会社电装_202380028041.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

口音识别声学模型训练、口音识别方法、装置和存储介质专利

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务