买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
摘要:方法、系统和装置,包括编码在计算机存储介质上的计算机程序,其用于学习用于训练机器学习模型的数据增强策略。在一个方面,一种方法包括:接收用于训练机器学习模型以执行特定机器学习任务的训练数据;确定多个数据增强策略,包括在多个时间步长中的每一个:基于在先前时间步长处生成的数据增强策略的质量度量,生成当前数据增强策略;使用当前数据增强策略,在训练数据上训练机器学习模型;以及,在使用当前数据增强策略已经对机器学习模型进行训练之后,使用该机器学习模型确定当前数据增强策略的质量度量;以及基于所确定的数据增强策略的质量度量,选择最终数据增强策略。
主权项:1.一种用于训练机器学习模型的方法,包括:接收用于训练所述机器学习模型以执行机器学习任务的训练数据,所述训练数据包括对所述机器学习模型的多个训练输入,其中所述机器学习任务包括图像处理任务、音频处理任务、视频分析任务或者自然语言处理任务;确定多个数据增强策略,其中,每个数据增强策略都具有多个数据增强策略参数,所述多个数据增强策略参数定义了在训练输入被用来训练所述机器学习模型之前变换所述训练输入的过程,所述确定包括,在多个时间步长的每一个处:针对一个或多个先前时间步长,基于在所述先前时间步长生成的数据增强策略的质量度量来生成当前数据增强策略,其中,针对每一个先前时间步长:在该先前时间步长所生成的数据增强策略的质量度量表征在已使用在该先前时间步长处生成的所述数据增强策略在所述训练数据上对所述机器学习模型进行训练之后,所述机器学习模型在验证数据集上的性能度量,所述验证数据集包括对所述机器学习模型的多个验证输入,其中,所述机器学习模型尚未在所述验证数据上被训练;使用所述当前数据增强策略,在所述训练数据上训练所述机器学习模型包括:从所述训练数据中选择一批训练输入;根据所述当前数据增强策略,通过对所述一批训练输入中的训练输入进行变换,确定增强后的一批训练输入;以及基于所述增强后的一批训练输入,调整所述机器学习模型的参数的当前值;以及在已使用所述当前数据增强策略在所述训练数据上对所述机器学习模型进行训练之后,使用所述机器学习模型确定所述当前数据增强策略的所述质量度量;基于所确定的数据增强策略的质量度量,选择最终数据增强策略;以及通过使用所述最终数据增强策略在所述训练数据上训练最终机器学习模型来生成最终训练过的机器学习模型。
全文数据:
权利要求:
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。