深圳市锐明像素科技有限公司王鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市锐明像素科技有限公司申请的专利基于多模态模型的城市设施异常检测方法、装置、电子设备及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119741614B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510245196.9,技术领域涉及:G06V20/10;该发明授权基于多模态模型的城市设施异常检测方法、装置、电子设备及程序产品是由王鹏;王鹏飞;刘加美设计研发完成,并于2025-03-04向国家知识产权局提交的专利申请。
本基于多模态模型的城市设施异常检测方法、装置、电子设备及程序产品在说明书摘要公布了:本申请公开了一种基于多模态模型的城市设施异常检测方法、检测装置、电子设备及计算机程序产品。该检测方法基于已训练的异常检测模型实现。异常检测模型在颈部网络设置TgVL模块,TgVL模块通过VFE分支增强图像特征,并通过TgV分支在文本引导下学习图像特征的权重,通过该权重对增强后的图像特征作注意力,可促进两种模态的特征融合,有效解决小样本学习困难的问题。基于此,结合TVF检测头,文本语义信息和图像的空间特征的多模态融合可提升对复杂场景的理解,更加准确高效地确定检测结果。此外,在骨干网络和或TgVL模块中设置的AGLPU模块,可利用LPU分支和GPU分支来提取局部特征及全局特征,并对二者进行自适应加权融合,进一步提升城市设施异常的检测精度。
本发明授权基于多模态模型的城市设施异常检测方法、装置、电子设备及程序产品在权利要求书中公布了:1.一种基于多模态模型的城市设施异常检测方法,其特征在于,包括: 基于预先训练完成的异常检测模型的骨干网络对待检测图像进行特征提取,得到图像特征;所述待检测图像包括城市设施; 基于所述异常检测模型的颈部网络对所述图像特征进行融合,得到第一融合特征; 基于所述异常检测模型的检测头对所述第一融合特征进行检测,得到所述待检测图像中城市设施异常的检测结果; 其中,所述颈部网络设置有TgVL模块,所述TgVL模块用于融合输入的第一图像特征及预设的引导文本的文本特征,得到第二融合特征,所述第一融合特征基于所述第二融合特征得到; 所述TgVL模块包括图像特征增强分支和文本引导图像分支以及第一融合层;针对所述第一图像特征及所述文本特征: 通过所述图像特征增强分支对所述第一图像特征进行处理,以得到增强图像特征; 通过所述文本引导图像分支对预处理后的所述第一图像特征和预处理后的所述文本特征依次执行求和操作和加权激活操作,得到引导学习权重; 通过所述第一融合层将所述增强图像特征和所述引导学习权重相乘并执行卷积操作,以得到所述第一图像特征及所述文本特征对应的第二融合特征; 所述文本引导图像分支包括图像特征预处理子分支、文本特征预处理子分支、爱因斯坦求和层以及MaxSigmoid激活函数层;所述求和操作包括爱因斯坦求和操作,所述通过所述文本引导图像分支对预处理后的所述第一图像特征和预处理后的所述文本特征依次执行求和操作和加权激活操作,得到引导学习权重,包括: 通过所述图像特征预处理子分支对所述第一图像特征依次执行卷积操作和重塑操作,得到预处理后的所述第一图像特征; 通过所述文本特征预处理子分支对所述文本特征依次执行线性操作和重塑操作,得到预处理后的所述文本特征; 通过所述爱因斯坦求和层对预处理后的所述第一图像特征和预处理后的所述第一图像特征进行爱因斯坦求和操作,得到第三融合特征; 通过所述MaxSigmoid激活函数层对所述第三融合特征执行MaxSigmoid函数激活操作,得到所述引导学习权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市锐明像素科技有限公司,其通讯地址为:518000 广东省深圳市南山区桃源街道长源社区学苑大道1001号B1栋2001;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。