买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华中科技大学;中国平安财产保险股份有限公司
摘要:本发明公开了一种基于知识蒸馏的语言模态去偏视觉问答方法,包括以下步骤:1获取给定的一张图像和关于图像的一个问题;2利用学生模型对所述问题和所述图像进行处理,获取所述问题的答案;其中,学生模型的获取过程如下:2.1构建教师模型和学生模型;2.2利用训练集对教师模型进行训练,其中,训练集数据包括图片、问题文本和答案文本;2.3对学生模型进行训练;2.4利用所述教师模型并基于设定的损失函数对所述学生模型进行知识蒸馏,固定教师模型的参数不更新,通过更新学生模型的参数来优化整个学习过程,获得训练完成的学生模型。本发明的方案通过引入一个教师模型,将其输出当作监督学生模型的软标签,可以避免了额外的数据标注。
主权项:1.一种基于知识蒸馏的语言模态去偏视觉问答方法,其特征在于,包括以下步骤:1获取给定的一张图像v∈I和关于图像的一个问题q∈Q;2利用学生模型对所述问题和所述图像进行处理,获取所述问题的答案;其中,学生模型的获取过程如下:2.1构建教师模型和学生模型;2.2利用训练集对教师模型进行训练,其中,训练集数据包括图片、问题文本和答案文本;2.3对学生模型进行训练;2.4利用所述教师模型并基于设定的损失函数对所述学生模型进行知识蒸馏,固定教师模型的参数不更新,通过更新学生模型的参数来优化整个学习过程,获得训练完成的学生模型。
全文数据:
权利要求:
百度查询: 华中科技大学 中国平安财产保险股份有限公司 基于知识蒸馏的语言模态去偏视觉问答方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。