买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院);山东大学;浙江大华技术股份有限公司;山东省计算中心(国家超级计算济南中心);山东师范大学
摘要:本发明属于多媒体检索技术领域,提供了面向实时任务的视频片段定位方法、系统、介质及设备,其技术方案为:获取视频和查询语句后,通过图像特征处理模型和自然语言特征处理模型来得出对应特征表示;通过跨模态动态哈希编码,将视频和查询语句两种不同模态的特征表示映射到同一汉明空间,而且动态哈希能够根据数据输入调整哈希编码;利用知识蒸馏技术从大参数量、高性能的教师模型中提取知识,并迁移至小参数量、低复杂度的学生模型中,从而构建轻量化的视频片段定位模型。本发明通过将动态哈希编码技术和蒸馏学习技术融合来构建轻量级模型,实现了高效捕捉视频内容的深层语义,同时确保实时任务的快速响应和准确性,解决了视频片段定位的困难。
主权项:1.面向实时任务的视频片段定位方法,其特征在于,包括如下步骤:获取历史视频数据和查询语句;基于历史视频数据、查询语句和训练后的教师模型得到第一视频片段和查询的匹配分数;在教师模型训练时,计算将视频不同片段和查询语句的特征表示映射至二值哈希空间时,根据不同的特征表示变化动态调整哈希编码的哈希编码损失;通过知识蒸馏将教师模型的知识迁移至轻量化学生模型中,通过学生模型得到第二视频片段和查询的匹配分数;根据第一视频片段和查询的匹配分数和第二视频片段和查询的匹配分数计算得到蒸馏损失;结合哈希编码损失和蒸馏损失得到总损失函数,以总损失函数最小化为策略定位的视频片段特征,作为查询语句对应的视频片段。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 山东大学 浙江大华技术股份有限公司 山东省计算中心(国家超级计算济南中心) 山东师范大学 面向实时任务的视频片段定位方法、系统、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。