买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
申请日:2022-06-28
公开(公告)日:2024-12-20
公开(公告)号:CN119173883A
专利技术分类:..学习方法[2023.01]
专利摘要:用于基于呈第一语言的第一文本序列、呈不同于第一语言的第二语言的第二文本序列以及基于第二文本顺序的源的标签来训练翻译模型的系统和方法。在一些示例中,标签可以包括互联网域、互联网子域、统一资源定位符、网站名称或IP地址。在一些示例中,标签还可以指示第一文本序列的源。在一些示例中,每个给定训练样例可以通过以下来自动生成:从给定互联网域的第一页面采样第一文本序列、从给定互联网域的第二页面采样第二文本序列、以及基于第二页面的源数据的全部或部分来生成标签。
专利权项:1.一种计算机实现的方法,包括:训练翻译模型,其中,所述训练包括:对于多个训练样例中的每个给定训练样例,所述给定训练样例包括呈第一语言的第一文本序列、呈不同于所述第一语言的第二语言的第二文本序列、以及基于所述第二文本序列的源的标签:使用所述翻译模型,至少部分地基于所述给定训练样例的所述第一文本序列和所述标签来生成预测的文本序列;以及使用处理系统的一个或多个处理器将所述预测的文本序列与所述第二文本序列进行比较以为所述给定训练样例生成损失值;以及使用所述一个或多个处理器至少部分地基于为所述多个训练样例中的每个训练样例生成的所述损失值来修改所述翻译模型的一个或多个参数。
百度查询: 谷歌有限责任公司 用于使用源增强的训练样例来训练翻译模型的系统和方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。