南京航空航天大学冯爱民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于类别感知的多模态工业异常检测与分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121304656B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511850844.X,技术领域涉及:G06T7/00;该发明授权一种基于类别感知的多模态工业异常检测与分割方法是由冯爱民;俞可扬;冯泉;梁睿君设计研发完成,并于2025-12-10向国家知识产权局提交的专利申请。
本一种基于类别感知的多模态工业异常检测与分割方法在说明书摘要公布了:本发明公开了一种基于类别感知的多模态工业异常检测与分割方法,属于图像异常检测与分割技术领域,包括:利用集成层次增强模块的视觉编码器提取多层次视觉特征,构建包含正常与异常语义的可学习文本提示;通过双向交叉注意机制实现视觉与文本特征的交互式更新,使两种模态在共享嵌入空间中获得一致表达;在检测阶段分别生成基线分支与类别感知分支的异常图,并在像素级进行层间一致性约束,确保跨尺度特征的空间与语义协调;通过自适应加权融合综合两分支结果,输出最终异常检测图。本发明方法利用视觉语言模型的跨模态语义对齐能力,实现对工业图像的异常检测与分割,无需异常样本、精度高、泛化性强,适用于各类工业缺陷检测与分割任务。
本发明授权一种基于类别感知的多模态工业异常检测与分割方法在权利要求书中公布了:1.一种基于类别感知的多模态工业异常检测与分割方法,其特征在于,包括如下步骤: S1、获取输入的待检测工业图像,并进行预处理,统一图像尺寸,通过集成有层次增强模块的视觉编码器,提取多个中间层的视觉特征; S2、根据预定义的正常与异常语义提示模板,构造与S1中视觉特征对应的文本特征; S3、将S1得到的视觉特征与S2得到的文本特征输入至交叉学习网络中,通过双向交叉注意机制,将两个模态的特征投射到共享嵌入空间,进行视觉与文本特征的细粒度语义对齐,输出跨模态嵌入特征; S4、基于S3输出的跨模态嵌入特征,将来自多个中间层的异常图上采样至统一尺度并融合,生成基线分支初步异常检测结果; S5、将待测工业图像输入类别感知提示模块,提取类别级语义信息,显式嵌入至文本提示模板中;再通过S1至S4处理流程,对多模态特征进行跨模态对齐与融合,生成类别感知分支异常检测结果; 具体包括如下子步骤: S51、通过类别感知提示模块提取图像类别级视觉特征,并注入文本提示,进行类别感知指导: 将输入图像通过预训练的CLIP图像编码器提取全局视觉特征,表示CLIP图像编码器输出的固定token长度; 将全局视觉特征输入至轻量级分类器中,所述分类器包含一维卷积层、特征转换层及分类头,同时选取分类头输入处的中间特征,作为图像类别特征,记为:,表示类别提示特征的维度; 进行文本提示构造,引入可学习的门控因子,将图像类别级特征与可学习文本提示进行融合; S52、在获得类别感知提示后采用与S1至S4相同处理流程,进行跨模态对齐与融合: 输入图像通过集成有层次增强模块的视觉编码器,提取多个中间层的视觉特征; 将得到的视觉特征与类别感知的文本特征输入至交叉学习网络中,通过双向交叉注意机制,将两个模态特征投射到共享嵌入空间,进行视觉与文本特征的细粒度语义对齐; 基于输出的跨模态嵌入特征,将来自多个中间层的异常图上采样至统一尺度并融合,生成类别感知分支的异常检测结果; S6、对S4得到的基线分支初步异常检测图与S5得到的类别感知分支异常检测图进行加权融合,生成最终的异常检测结果图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励