西安交通大学陈霸东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安交通大学申请的专利基于注意力机制的无监督域适应提示微调方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117218415B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311136648.7,技术领域涉及:G06V10/764;该发明授权基于注意力机制的无监督域适应提示微调方法及相关装置是由陈霸东;白双豪;周婉琪;栾智荣;党路娟设计研发完成,并于2023-09-04向国家知识产权局提交的专利申请。
本基于注意力机制的无监督域适应提示微调方法及相关装置在说明书摘要公布了:本发明公开了一种基于注意力机制的无监督域适应提示微调方法及相关装置,通过提示学习引入少量可学习参数并冻结整个CLIP模型,可以快速高效地将模型适应于域自适应图片分类任务。同时,为了进一步提升准确度,引入了注意力机制,建立两个域的特征库以得到注意力特征对,注意力特征对和输入图片的特征一并输入注意力模块以得到融合了源域和目标域信息的特征,该特征用于后续的分类。设计的注意力分支的框架可以更好地捕捉到目标域的域不变特征,故而提升域自适应图片分类的准确率。
本发明授权基于注意力机制的无监督域适应提示微调方法及相关装置在权利要求书中公布了:1.基于注意力机制的无监督域适应提示微调方法,其特征在于,包括以下步骤: 冻结对比学习语言-图像预训练模型CLIP中的图片特征提取器和文本特征提取器的可学习参数; 学习对比学习语言-图像预训练模型CLIP中的提示与注意力模块的参数,构建源域特征库和目标域特征库; 将对比学习语言-图像预训练模型CLIP分为基准分支和注意力分支,利用根据源域特征库和目标域特征库进行训练,完成对比学习语言-图像预训练模型CLIP的无监督域适应提示微调; 所述利用根据源域特征库和目标域特征库进行训练,对于基准分支: 将提示插入图片和文本两端的输入中,图像的预测后验概率分布由式1表示;使用对比学习语言-图像预训练模型CLIP生成伪标签;设置一个固定阈值,用于过滤掉不可靠的伪标签;如果对比学习语言-图像预训练模型CLIP对于给定图像预测的最大概率低于此阈值,则将丢弃伪标签;采用交叉熵作为损失函数进行模型的训练: 其中,为基准分支中源域数据的损失函数,为源域数据的批量数,为最大值的索引,为一个批次的源域数据的概率分布,为基准分支中目标域数据的损失函数,为目标域数据的批量数,为一个批次的目标域数据的概率分布,为源域图片数据,为真实的源域标签,为目标域图片数据,为目标域过滤后的伪标签,和分别是源域图片和目标域图片特征与其文本特征的相似度,为提示的可学习参数; 所述利用根据源域特征库和目标域特征库进行训练,对于注意力分支: 首先应用一个权值共享的投影层,将一张输入的图像特征、源域特征库和目标域特征库转换为相应的查询、键和值表示,表示为: 应用自注意力和交叉注意力来捕捉特征之间的依赖关系,具体表示为: 其中,为与源域特征库的融合特征,为源域特征库转换后的值的转置,为转置,为缩放超参数,为与目标域特征库的融合特征,为目标域特征库转换后的值的转置; 使用另一个权值共享的投影层再次投影注意力值,表示为: 其中,为重映射的与源域特征库的融合特征,为重映射的与源域特征库的融合特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。