哈尔滨工业大学刘铭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利基于多模态大模型的工业图像异常检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119762891B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411973769.1,技术领域涉及:G06V10/764;该发明授权基于多模态大模型的工业图像异常检测方法是由刘铭;李沅泽;苑世豪;王浩霖;李启璋;闫子飞;徐晨;石光明;左旺孟设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本基于多模态大模型的工业图像异常检测方法在说明书摘要公布了:基于多模态大模型的工业图像异常检测方法,属于工业异常检测领域,本发明为解决多模态大模型进行工业异常检测时存在可扩展性和适应性差、在图像中识别微小异常能力弱的问题。本发明包括步骤1、基于工业异常检测数据集构建知识理解训练任务,步骤2、利用专家引导的图像采样模块预测异常图并提取N个感兴趣区域,将N个感兴趣区域连同输入的原图一起输入视觉编码器中,以提取视觉特征,并输出大语言模型能识别的视觉编码;步骤3、构建视觉语言对齐的工业异常检测指令集;步骤4、利用知识理解训练任务和工业异常检测指令集对多模态大模型进行微调;步骤5、利用训练好的多模态大模型对工业产品进行异常检测。
本发明授权基于多模态大模型的工业图像异常检测方法在权利要求书中公布了:1.基于多模态大模型的工业图像异常检测方法,其特征在于,多模态大模型包括大语言模型和专家引导的图像采样模块,工业图像异常检测方法包括以下步骤: 步骤1、基于工业异常检测数据集构建知识理解训练任务,所述知识理解训练任务包括基于生产工序的多模态知识理解任务和基于生产工序合成的纯文本知识理解任务两类; 步骤2、利用专家引导的图像采样模块预测异常图并提取N个感兴趣区域,将N个感兴趣区域连同输入的原图一起输入视觉编码器中,以提取视觉特征,并输出大语言模型能识别的视觉编码; 步骤3、构建视觉语言对齐的工业异常检测指令集; 步骤4、利用知识理解训练任务和工业异常检测指令集对多模态大模型进行微调; 步骤5、利用训练好的多模态大模型对工业产品进行异常检测: 输入工业产品的视觉图像,由专家引导的图像采样模块输出视觉特征;所述视觉特征嵌入附加的生产工序文本提示和指令作为整体序列,输入给训练好的多模态大模型中,由大模型根据文本指令给出二元判断或者详细的异常描述和分析,从而完成工业异常检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。