杭州华数智屏信息技术有限公司崔峥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州华数智屏信息技术有限公司申请的专利基于多模态智能体驱动的OTT视觉特征提取系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120676177B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511156485.8,技术领域涉及:H04N21/2187;该发明授权基于多模态智能体驱动的OTT视觉特征提取系统及方法是由崔峥;陈明月;姚康康设计研发完成,并于2025-08-19向国家知识产权局提交的专利申请。
本基于多模态智能体驱动的OTT视觉特征提取系统及方法在说明书摘要公布了:本发明涉及互联网电视服务技术领域,具体为基于多模态智能体驱动的OTT视觉特征提取系统及方法,包括:捕获设备的屏幕实时视频流;对目标广告图像及实时视频流进行处理,通过多模态视觉感知模型提取出双流异构视觉特征,包括全局内容感知特征和局部几何结构特征;执行分层匹配算法,利用全局内容感知特征进行计算筛选出候选帧,在候选帧内利用局部几何结构特征进行匹配建立包含所有匹配的初始关键点对应关系集合,对集合进行空间聚类分离出广告实例,通过几何变换计算获得实例的边界框;根据边界框,在原始视频帧上对目标广告所在区域进行高亮显示生成可视化监播结果。本发明通过多模态智能体驱动,实现OTT广告视觉特征提取与监播。
本发明授权基于多模态智能体驱动的OTT视觉特征提取系统及方法在权利要求书中公布了:1.基于多模态智能体驱动的OTT视觉特征提取系统,其特征在于,包括: 监播任务解析模块,接收包含目标广告图像及导航指令序列的监播任务,通过物联网接口向OTT设备发送导航指令用于执行界面操控,捕获设备的屏幕实时视频流; 双流异构特征提取模块,对目标广告图像及实时视频流进行处理,通过多模态视觉感知模型提取出双流异构视觉特征,所述双流异构视觉特征包括全局内容感知特征和局部几何结构特征;所述多模态视觉感知模型包括: 视觉空间编码器,接收实时视频流中的当前帧静态图像作为输入,采用第一卷积神经网络进行处理,生成高分辨率的、蕴含丰富空间细节的空间内容特征图,所述空间内容特征图作为局部几何结构特征; 动态变化编码器,接收当前帧与前一帧的差分图像作为输入,采用第二卷积神经网络进行处理,捕捉屏幕上发生变化的区域、方向和模式,生成动态变化特征向量; 指令情境编码器,接收导致当前界面状态的导航指令作为输入,采用预置的嵌入查找表与多层感知机进行处理,将指令文本映射为低维的指令情境特征向量; 多模态注意力融合单元,将所述动态变化特征向量与指令情境特征向量进行拼接,将拼接后的复合向量输入至注意力生成网络,生成注意力权重向量,将所述注意力权重向量应用于所述视觉空间编码器输出的空间内容特征图,通过通道注意力机制和空间注意力机制进行动态重标定,对特征图进行加权,输出全局内容感知特征; 多阶段匹配模块,执行分层匹配算法,利用全局内容感知特征进行计算,筛选出候选帧,在候选帧内,利用局部几何结构特征进行匹配建立包含所有匹配的初始关键点对应关系集合,对集合进行空间聚类分离出广告实例,通过几何变换计算获得广告实例的边界框; 结果生成模块,根据边界框,在原始视频帧上对目标广告所在区域进行高亮显示添加可视化标记,生成可视化监播结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州华数智屏信息技术有限公司,其通讯地址为:310000 浙江省杭州市余杭区五常街道爱橙街1号10幢2单元3层E320-1室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励