Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 石家庄铁道大学张云佐获国家专利权

石家庄铁道大学张云佐获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉石家庄铁道大学申请的专利基于全局记忆检索与双流动态融合的视频摘要生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120298956B

龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510753788.1,技术领域涉及:G06V20/40;该发明授权基于全局记忆检索与双流动态融合的视频摘要生成方法是由张云佐;薛丽烨;仇紫悦;张志国;王辉;马新娜;王书海设计研发完成,并于2025-06-06向国家知识产权局提交的专利申请。

基于全局记忆检索与双流动态融合的视频摘要生成方法在说明书摘要公布了:本发明公开了一种基于全局记忆检索与双流动态融合的视频摘要生成方法,属于计算机视觉技术领域。所述方法包括:对输入视频帧序列进行特征提取,得到时序视频特征;将时序视频特征输入视频摘要生成模型,通过模型预测帧级重要性分数;将所述帧级重要性分数与中心置信度进行加权融合,获得最终帧级重要性得分;对所述帧级重要性得分执行时序非极大值抑制处理,抑制相邻高得分帧中的冗余帧,根据处理后的结果选择关键帧,并生成最终视频摘要。在基准数据集SumMe和TVSum上得到的实验结果证明了该方法的先进性。本发明所提出的视频摘要生成方法可以有效地提升长视频的时序建模能力和关键帧选择的准确性。

本发明授权基于全局记忆检索与双流动态融合的视频摘要生成方法在权利要求书中公布了:1.一种基于全局记忆检索与双流动态融合的视频摘要生成方法,其特征在于,包括以下步骤: S1:对输入视频帧序列进行特征提取,得到视频时序特征; S2:将视频时序特征输入视频摘要生成模型,通过模型预测帧级重要性分数,所述视频摘要生成模型包括: 全局记忆检索模块:所述全局记忆检索模块以所述视频时序特征作为输入,通过可学习的全局内存矩阵进行注意力检索,生成融合全局语义的增强语义特征,具体操作步骤如下: 构建可学习的全局内存矩阵,其中K为内存容量,Dm为内存维度,表示维度为m行n列的实数矩阵; 注意力检索: 通过线性投影将视频时序特征映射为查询向量,其中T为时序长度,D为输入特征维度; 计算查询向量Q与全局内存矩阵M的相似度矩阵,经Softmax归一化生成注意力权重; 根据注意力权重A对全局内存矩阵M进行特征检索,生成全局语义特征; 所述特征检索操作如下: 将所述注意力权重与所述全局内存矩阵进行矩阵乘法运算,得到全局语义特征; 所述特征检索按如下规则计算: , 其中表示第k个内存块的特征向量,Dm为内存维度,K为内存容量,t表示第t个查询向量; 将全局语义特征Fg通过线性投影映射到维度D,得到,并与视频时序特征进行残差连接,输出增强语义特征Fe,具体计算公式如下: , 其中LayerNorm·表示层归一化操作,Fg'表示全局语义特征经线性投影后的特征,F'表示视频时序特征,α为预设残差权重,取值范围为0.1≤α≤0.5; 双流动态融合模块:所述双流动态融合模块以所述增强语义特征作为输入,分别通过前向卷积路径与反向卷积路径提取时序显著性特征,并基于动态门控融合,得到时序融合特征; 多任务决策模块:所述多任务决策模块以所述时序融合特征作为输入,通过多任务预测头并行生成帧级重要性分数、片段边界偏移量和中心置信度; S3:将所述帧级重要性分数与中心置信度进行加权融合,获得最终帧级重要性得分; S4:对所述帧级重要性得分执行时序非极大值抑制处理,抑制相邻高得分帧中的冗余帧,根据处理后的结果选择关键帧,并生成最终视频摘要。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人石家庄铁道大学,其通讯地址为:050043 河北省石家庄市长安区北二环东路17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。