买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:昆明理工大学
摘要:本发明涉及基于自我对比学习克服视觉问答的语言先验方法,本发明首先通过预训练模型完成图像特征提取,将问题词嵌入之后输入GRU生成一个问题特征;再对问题和图像使用注意力机制,将问题特征与图像特征融合为一个联合表示特征,对于反注意力层使用注意力机制学习的权重值,将问题特征与反图像特征融合为另一个联合表示特征,两者构成对比;再通过优化基础的VQA分类损失以及利用自对比学习损失Lscl来增加问题与图像的相关性,将这两个损失构成联合损失去训练。该方法建立在模型LMH之上,在不使用辅助任务的情况下在最常用的基准VQACPv2上实现了59.00%的最先进性能,绝对性能提升了6.51%。
主权项:1.一种基于自我对比学习克服视觉问答的语言先验方法,其特征在于:所述方法的具体步骤如下:Step1、首先将问题、图像与答案选项作为实验数据,其次对图像进行预处理提取特征图,并将问题预处理生成问题特征向量;Step2、使用注意力层学习去识别图像与问题相关区域;经Step1预处理操作之后,注意力机制利用问题来计算图像区域上的注意力权重,以定位与问题相关的图像区域,将得到的问题特征q和加权后的图像特征融合为联合表示r;Step3、使用反注意力层识别当前不相关或不太相关的图像区域;以利用Step2获得的注意力权重值,将问题特征q和加权后的反图像特征融合为联合表示r0,将问题集中在不相关的区域并忽略图像上的相关区域以形成对比;Step4、后处理:通过Step3得到的联合表示r0以及Step1得到的联合表示r,训练网络来优化自对比损失Lscl和基础VQA分类损失Lvqa的联合损失,能专注于相关区域来预测关于输入图像的给定问题的正确答案。
全文数据:
权利要求:
百度查询: 昆明理工大学 一种基于自我对比学习克服视觉问答的语言先验方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。