买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:百度(美国)有限责任公司
申请日:2016-11-23
公开(公告)日:2017-11-28
公开(公告)号:CN107408111A
专利技术分类:
专利摘要:公开了端对端深度学习系统和方法的实施例,以识别截然不同的诸如英语或普通话等的语言的语音。在实施例中,用神经网络代替手工工程化部件的整个流水线,并且端对端学习允许处理包括噪声环境、口音和不同语言的各种各样的语音。将训练的实施例和利用GPU的批量调度技术的实施例运用在数据中心中,能够以较低的成本将端对端深度学习系统部署到在线设置中,从而在大规模用户服务时提供低延迟。
专利权项:一种用于训练语音转录的转录模型的由计算机实现的方法,所述方法包括:对于话语集中的每个话语:从每个话语获得一组谱帧,所述话语具有相关联的真实标签,所述话语和所述相关联的真实标签采样自包括多个小批量的训练集;从所述转录模型输出对所述话语的预测字符或字符概率,所述转录模型包括一个或多个卷积层和一个或多个递归层,批量归一化被应用于所述多个小批量中的一个或多个小批量以对所述一个或多个递归层中的至少一个中的预激活进行归一化;给定相关联的真实标签来计算损失,以测量对所述话语的字符预测中的误差;相对于所述转录模型的参数,计算所述损失的导数;以及利用所述导数通过反向传播来更新所述转录模型。
百度查询: 百度(美国)有限责任公司 端对端语音识别
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。