买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京工业大学
摘要:本发明提供一种基于全局感知特征融合与样本关系学习的视频描述方法,属于视频描述领域。所述视频描述方法包括利用Inception‑ResNet‑V2模型提取视频静态特征;利用C3D模型提取视频动态特征;利用Faster‑RCNN模型提取视频对象特征;利用SBERT模型提取中视频对应字幕的语义标签;使用提出的样本关系学习模块学习样本之间的关系特征,利用全局感知特征融合模块控制特征融合权重,缓解累积的权重分配偏差问题,提高生成字幕的确性。
主权项:1.一种基于全局感知特征融合与样本关系学习的视频描述方法,其特征在于,所述方法包括以下步骤:步骤1:视频特征提取,利用2D-CNN模型提取静态特征,利用3D-CNN模型提取动态特征,利用R-CNN模型提取对象特征;步骤2:语义标签提取,利用SBERT模型提取中视频对应字幕的动词标签、谓词标签和名词标签;步骤3:将步骤1提取的视频特征输入样本间关系学习模块,学习样本之间的关系特征并将关系特征和视频特征拼接获得混合视频特征;步骤4:将步骤3获得的混合视频特征输入编码器获得视觉信息特征;利用步骤2的语义标签对视觉信息特征进行处理获得语义特征;步骤5:将步骤4的视觉信息特征和步骤5语义特征输入解码器,利用全局感知特征融合模块感知全局权重分配情况,控制当前特征融合权重分配;步骤6:通过LSTM生成视频描述。
全文数据:
权利要求:
百度查询: 南京工业大学 一种基于全局感知特征融合与样本关系学习的视频描述方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。