买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学院自动化研究所;百度在线网络技术(北京)有限公司
摘要:本发明提供一种图文预训练模型的训练方法、训练装置及电子设备,涉及深度学习技术领域,该方法包括:构建初始图文预训练模型,初始图文预训练模型包含生成器模块和判别器模块,生成器模块和判别器模块均包含图像编码器、文本编码器和跨模态融合编码器,跨模态融合编码器用于融合图像编码器和文本编码器输出的特征;针对每种预训练任务,基于生成器模块的生成结果对判别器模块进行训练,并基于训练后的判别器模块,得到目标图文预训练模型。使得最终得到的目标图文预训练模型能够与下游任务完全匹配,从而能够在各种图文下游任务中取得更好的效果。
主权项:1.一种图文预训练模型的训练方法,其特征在于,包括:构建初始图文预训练模型,所述初始图文预训练模型包含生成器模块和判别器模块,所述生成器模块和所述判别器模块均包含图像编码器、文本编码器和跨模态融合编码器,所述跨模态融合编码器用于融合所述图像编码器和所述文本编码器输出的特征;针对每种预训练任务,基于所述生成器模块的生成结果对所述判别器模块进行训练,并基于训练后的所述判别器模块,得到目标图文预训练模型;所述基于所述生成器模块的生成结果对所述判别器模块进行训练,包括:将预训练任务对应的训练样本输入所述生成器模块,根据所述生成器模块的生成结果确定困难样本;基于所述困难样本对所述判别器模块进行训练;所述根据所述生成器模块的生成结果确定困难样本,包括:将所述生成器模块生成错误结果的负样本或负样本对确定为困难样本。
全文数据:
权利要求:
百度查询: 中国科学院自动化研究所 百度在线网络技术(北京)有限公司 图文预训练模型的训练方法、训练装置及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。