北京美数信息科技有限公司代磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京美数信息科技有限公司申请的专利多模态广告库存智能匹配系统的视频内容理解方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120388324B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510880057.3,技术领域涉及:G06V20/40;该发明授权多模态广告库存智能匹配系统的视频内容理解方法是由代磊;郭麒;徐忠旺;范昂设计研发完成,并于2025-06-27向国家知识产权局提交的专利申请。
本多模态广告库存智能匹配系统的视频内容理解方法在说明书摘要公布了:本申请涉及视频内容理解技术领域,具体涉及多模态广告库存智能匹配系统的视频内容理解方法,该方法包括:以原始广告视频的视频帧为基准,在每个视频帧的时间戳所在镜头中,分析相邻视频帧的相似度以及语音段对应特征矩阵元素的离散程度,确定第一搜索窗口;同时,分析文本片段在单位时间内的出现频率和持续时长,确认第二搜索窗口;基于搜索窗口,分析语音段和文本片段在对应窗口内与视频帧的特征相似程度,获取最优对齐路径;将语音段、文本片段的时间戳与视频帧时间戳对齐,通过多模态融合技术、深度学习模型实现多层级语义解析。本申请旨在同步音频、文本与视频帧之间的时序关系,提示视频内容理解的准确性。
本发明授权多模态广告库存智能匹配系统的视频内容理解方法在权利要求书中公布了:1.多模态广告库存智能匹配系统的视频内容理解方法,其特征在于,该方法包括以下步骤: 对原始广告视频进行视频帧提取,镜头分割;从原始广告视频中提取音频信号,得到语音段;从原始广告视频中读取文本片段; 基于每个镜头分割的起止时间对相应时间戳的视频帧、语音段、文本片段进行划分; 以视频帧为基准,在每个视频帧对应时间戳所在镜头中,分析相邻视频帧之间的相似程度以及语音段对应的频谱信息的离散程度,确定每个视频帧对应时间戳的动态平衡因子,对每个视频帧对应时间戳的预设基准窗口大小进行调整,得到第一搜索窗口; 在每个视频帧对应时间戳所在的镜头中,分析时间戳对应文本片段在单位时间内的出现频率以及持续时长,确认每个视频帧对应时间戳的文本动态因子,对每个视频帧对应时间戳的预设基准窗口大小进行调整,得到第二搜索窗口; 基于第一搜索窗口以及第二搜索窗口,分析语音段和文本片段在对应窗口内与视频帧的特征相似程度,得到第一稀疏矩阵、第二稀疏矩阵,获取第一最优对齐路径、第二最优对齐路径; 基于得到的最优对齐路径,将语音段、文本片段的时间戳与视频帧时间戳对齐,通过多模态融合技术整合时间戳对齐的视频帧、语音段、文本片段信息,通过深度学习模型实现多层级语义解析。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京美数信息科技有限公司,其通讯地址为:100020 北京市朝阳区金桐西路10号1单元27层2701内01、02室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。