Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

两阶段的anchor-based动态视频摘要方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明是一种两阶段的anchor‑based动态视频摘要方法。该方法包括1构建anchor‑based神经网络,神经网络包括提取网络、自注意力机制网络、两阶段网络即区域推荐网络和回归分类网络;2确定区域推荐网络和回归分类网络中anchor的种类和长度,完成正负样本的分类,对步骤1构建的anchor‑based神经网络进行训练,固定训练好的参数,得到两阶段的anchor‑based神经网络模型,用得到的神经网络模型进行动态视频摘要。本发明提出的全新网络结构可以并行处理所有的视频帧,从而减少了训练的时间,有效提升了最终输出的精确度,并且本网络结构相对简单,对于计算能力的要求不高。

主权项:1.一种两阶段的anchor-based动态视频摘要方法,其特征在于:所述方法包括如下步骤:1构建anchor-based神经网络,所述神经网络包括提取网络、自注意力机制网络、两阶段网络即区域推荐网络和回归分类网络;2确定所述区域推荐网络和回归分类网络中anchor的种类和长度,完成正负样本的分类,对步骤1构建的anchor-based神经网络进行训练,固定训练好的参数,得到两阶段的anchor-based神经网络模型;3用步骤2得到的神经网络模型进行动态视频摘要,其中:所述步骤2神经网络模型构建包括如下步骤:2.1分析训练集中标签片段的长度,通过K-means算法得出anchor的长度,用[L1,L2,L3,L4]分别表示这四种anchor的长度,其中,L1至L4依次递增;2.2将步骤2.1结果的最大值L4确定为此网络anchor的长度,保证此网络anchor的长度大于数据集中大多数标签片段的长度;2.3对于从视频中抽取的N帧,依次以每一帧为中心,以L4为长度,进行片段的截取,共产生N个片段,用S1表示这N个片段:S1={s1,s2...si...sN}其中,si表示截取产生的以第i帧为中心、L4为长度的片段,然后计算这些片段与标签片段的交集IOU的大小,若片段的IOU>=α,则将其标记为正样本,若片段的IOU<α,则将其标记为负样本,保证正负样本的数量比例为3∶1;2.4回归分类网络采用的是多尺度的anchor机制,anchor的种类为4,长度分别为[L1,L2,L3,L4];2.5对于从视频中抽取的N帧,依次以每一帧为中心,分别以L1,L2,L3,L4为长度,进行片段的截取,共产生4*N个片段,用S2表示这4*N个片段:S2={s11,s12...sij...sN4}其中,sij表示截取产生的以第i帧为中心,Lj为长度的片段,0<i<N+1,0<j<5,然后计算这些片段与标签片段的交集IOU的大小,若片段的IOU>=β,则将其标记为正样本,若片段的IOU<β,则将其标记为负样本,保证正负样本的数量比例为3∶1;2.6利用步骤2.1至步骤2.5得到的正负样本,对步骤1构建的网络进行训练,固定训练好的参数,得到两阶段的anchor-based神经网络模型。

全文数据:

权利要求:

百度查询: 南京邮电大学 两阶段的anchor-based动态视频摘要方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。