买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于补丁语义亲和力增强的CAM优化方法,包括:提取多头自注意力权重;使用头平均操作去除冗余信息,再通过全局平均池化聚合每个注意力图的全局特征,并将聚合的特征向量输入多层感知机中进行相互作用,获得考虑了不同层注意力重要性的增强注意力图;进行平均操作融合后除去注意力中类令牌对应维度,剩下的权重作为增强后的补丁语义亲和力矩阵;输出的补丁令牌生成CAM,利用语义亲和力捕捉更多空间关系和细粒度信息的能力,将补丁语义亲和力矩阵与CAM作矩阵相乘完成优化。本发明在无需额外计算的情况下获取包含语义亲和力信息的注意力权重矩阵,并通过头平均注意力融合模块对注意力权重矩阵进行融合增强。
主权项:1.一种基于补丁语义亲和力增强的CAM优化方法,其特征在于,包括如下步骤:步骤1、从VisionTransformer骨干网络中提取多头自注意力权重;步骤2、对于步骤1中提取的多头自注意力权重,使用头平均操作去除冗余信息并减少计算量,再通过全局平均池化聚合每个注意力图的全局特征,并将聚合得到的特征向量输入多层感知机中进行相互作用,提取更复杂的特征相互关系,最后获得来自不同层注意力重要性的增强注意力图;步骤3、将步骤2来自不同层注意力重要性的增强注意力图,进行平均操作来融合,并除去自注意力中类令牌对应的维度,剩下的权重作为增强后的补丁级语义亲和力矩阵;步骤4、基于步骤3获得的补丁级语义亲和力矩阵,利用语义亲和力捕捉更多空间关系和细粒度信息的能力,从最后一层Transformer编码器块输出的补丁令牌生成类激活图CAM,并使用补丁语义亲和力矩阵与CAM作矩阵相乘完成对CAM的优化,使CAM更加细化和精准,从而得到更优质的伪标签用于监督分割模型的训练。
全文数据:
权利要求:
百度查询: 南京信息工程大学 一种基于补丁语义亲和力增强的CAM优化方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。