中国民用航空总局第二研究所;民航成都电子技术有限责任公司邵杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国民用航空总局第二研究所;民航成都电子技术有限责任公司申请的专利一种基于多模态大模型的智慧视频巡检方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121582883B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610106014.4,技术领域涉及:G06V20/52;该发明授权一种基于多模态大模型的智慧视频巡检方法和系统是由邵杰;郑怀宇;汤滔;党婉丽;王江;牛杰;耿龙;王朝;唐浩;王思博;陈鑫鑫设计研发完成,并于2026-01-27向国家知识产权局提交的专利申请。
本一种基于多模态大模型的智慧视频巡检方法和系统在说明书摘要公布了:本发明属于机场管理领域,涉及一种基于多模态大模型的智慧视频巡检方法和系统,包括步骤1,基于机场数据中的非结构化文本,构建结构化知识图谱,并基于结构化知识图谱的节点,得到高维语义向量;步骤2,对包括监控视频在内的多种数据进行特征提取,生成多模态联合特征表征;多模态联合特征表征包括时空信息和规则上下文;步骤3,基于高维语义向量和多模态联合特征表征,判断航站楼是否发生异常事件;步骤4,若发生异常事件,则基于异常事件生成结构化指令,并基于结构化指令对航站楼进行闭环优化;以基于机场现有的视频监控环境和数据基础,为航站楼智慧巡检提供一体化智能系统,实现巡检的自动化、精细化和闭环管理。
本发明授权一种基于多模态大模型的智慧视频巡检方法和系统在权利要求书中公布了:1.一种基于多模态大模型的智慧视频巡检方法,其特征在于,包括: 步骤1,基于机场数据中的非结构化文本,构建结构化知识图谱,并基于结构化知识图谱的节点,得到高维语义向量; 步骤2,对包括监控视频在内的多种数据进行特征提取,生成多模态联合特征表征;多模态联合特征表征包括时空信息和规则上下文;对包括监控视频在内的多种数据进行特征提取,生成多模态联合特征表征,包括: 步骤2.1,对监控视频进行视频时空特征提取,得到高维视觉特征向量;高维视觉特征向量用于表征微观目标特征和宏观群体行为特征;微观目标特征包括视频画面中每个行人的唯一标识、在航站楼坐标系中的3D空间坐标和实时移动速度;宏观群体行为特征包括指定区域内的人群密度、排队区域的排队长度和人群聚集区域的空间分布; 步骤2.2,根据当前视频帧所示的场景,检索相关的标准操作程序文本片段,并基于标准操作程序文本片段,生成上下文知识向量;上下文知识向量代表了当前场景下应当遵守的规则的语义表示; 步骤2.3,将高维视觉特征向量和上下文知识向量进行对齐后融合,得到多模态联合特征表征;多模态联合特征表征的计算公式为: ; 其中,为多模态联合特征表征;CMFAN为跨模态特征注意力网络;为高维视觉特征向量;为上下文知识向量; 步骤3,基于高维语义向量和多模态联合特征表征,判断航站楼是否发生异常事件,包括: 步骤3.1,计算多模态联合特征表征分别与多个高维语义向量的相似度,并基于相似度阈值,确定激活图谱节点和潜在异常事件;计算多模态联合特征表征分别与多个高维语义向量的相似度的计算公式为: ; 其中,ActivationLevel为相似度;CosineSimilarity为余弦相似度算法;为当前视频的多模态联合特征表征;为督查标准的高维语义向量; 步骤3.2,基于激活图谱节点的邻居节点信息构建上下文知识,并基于多模态联合特征表征与上下文知识进行概率推理,得到事件判定结果和置信度概率; 步骤3.3,当置信度概率大于预设置信度阈值时,判定发生所述潜在异常事件; 步骤4,若发生异常事件,则基于异常事件生成结构化指令,并基于结构化指令对航站楼进行闭环优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国民用航空总局第二研究所;民航成都电子技术有限责任公司,其通讯地址为:610041 四川省成都市武侯区二环路南二段17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励