首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

音频流的稳定实时翻译 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:谷歌有限责任公司

摘要:方法、系统和装置,包括编码在计算机存储介质上的计算机程序,其有助于生成以源语言记录的输入音频数据流的目标语言中的稳定实时文本翻译。获得以第一语言记录的音频流。可以生成在多个连续时间间隔的每个时间间隔处的音频的局部转录。每个局部转录可以被翻译成不同于第一语言的第二语言。可以将每个已翻译局部转录输入到模型,该模型确定输入的已翻译局部转录的一部分是否为稳定的。基于输入的已翻译局部转录,模型标识预测为稳定的已翻译局部转录的该部分。提供了已翻译局部转录的该稳定部分用于在用户设备上显示。

主权项:1.一种用于生成稳定实时翻译的计算机实现的方法,包括:获得音频数据流;确定记录所述音频数据流中的音频的第一语言;生成在多个连续时间间隔中的每个时间间隔处的所述音频的局部转录,其中,每个局部转录是从所述音频的开始直到特定时间间隔为止的所述音频的转录,并且所述第一语言的;以及对于每个局部转录:将所述局部转录翻译成与所述第一语言不同的第二语言;将已翻译局部转录输入到机器学习模型,其中,所述机器学习模型被配置为预测输入的已翻译局部转录的一部分是否为稳定的,所述机器学习模型被训练为最小化损失函数并且是使用以下而被训练的:从以所述第一语言记录的一个或多个训练音频数据文件生成的一组转录翻译以及对应一组稳定值,每个稳定值指示相应组翻译是否稳定,其中,所述一组稳定值是使用一组规则生成的;使用所述机器学习模型生成指示已翻译局部转录的一部分是稳定的预测,其中,当所述输入的已翻译局部转录的一部分预期为不会在所记录音频的另一个已翻译局部转录中变化,直到比所述输入的局部转录的时间间隔更晚的时间间隔为止时,则输入的已翻译局部转录的该部分是稳定的;以及响应于生成指示所述已翻译局部转录的所述部分为稳定的所述预测,提供所述已翻译局部转录的所述部分用于在用户设备上显示并使用所述预测。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 音频流的稳定实时翻译

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。