长春工业大学梁超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长春工业大学申请的专利一种视频行为识别方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121583007B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610114338.2,技术领域涉及:G06V40/20;该发明授权一种视频行为识别方法、装置、设备及存储介质是由梁超;张冰冰;姜长泓设计研发完成,并于2026-01-28向国家知识产权局提交的专利申请。
本一种视频行为识别方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种视频行为识别方法、装置、设备及存储介质,涉及视频识别技术领域,包括:通过第一语言模型对训练视频的视频帧进行处理,得到各所述视频帧对应的行为描述信息;利用第二语言模型对单个动作类别对应的各所述行为描述信息进行处理,得到相应各所述动作类别对应的文本提示信息;基于各所述文本提示信息以及所述训练视频对应的视觉特征信息进行模型训练,并利用训练后模型对待识别视频进行识别得到相应的视频行为识别结果。可见,本申请可将简短的行为描述信息扩展为语义丰富的文本提示信息,并进行模型训练,改善了跨模态对齐的质量,降低了语义模糊性,可得到对视频行为的理解和识别性能更优的模型,最终提高视频行为的识别效果。
本发明授权一种视频行为识别方法、装置、设备及存储介质在权利要求书中公布了:1.一种视频行为识别方法,其特征在于,包括: 通过第一语言模型对训练视频的视频帧进行处理,得到各所述视频帧对应的行为描述信息; 利用第二语言模型对单个动作类别对应的各所述行为描述信息进行处理,得到相应各所述动作类别对应的文本提示信息; 基于各所述文本提示信息以及所述训练视频对应的视觉特征信息进行模型训练,并利用训练后模型对待识别视频进行识别得到相应的视频行为识别结果; 其中,所述利用第二语言模型对单个动作类别对应的各所述行为描述信息进行处理,得到相应各所述动作类别对应的文本提示信息,包括: 根据动作类别对各所述行为描述信息进行分组聚合,得到对应不同所述动作类别的各聚合后描述信息; 利用第二语言模型对各所述聚合后描述信息分别进行处理,得到相应各所述动作类别对应的文本提示信息; 其中,所述视觉特征信息的提取过程,包括: 基于时序卷积提取所述训练视频的局部区域特征,并基于时序差分和全局二阶池化技术提取所述训练视频的动态区域特征; 通过残差连接的方式对所述局部区域特征、所述动态区域特征以及原始特征进行融合,得到所述训练视频的视觉特征信息;所述原始特征为所述训练视频的视频帧经图像块嵌入得到的特征; 其中,所述基于时序差分和全局二阶池化技术提取所述训练视频的动态区域特征,包括: 基于时序差分对所述原始特征进行特征提取得到初始动态区域特征; 根据所述初始动态区域特征的协方差矩阵,利用预设神经网络生成通道注意力权重;所述预设神经网络为基于分组卷积、批归一化以及非线性激活函数构建的神经网络; 利用所述通道注意力权重对所述初始动态区域特征进行重标定,并通过残差连接的方式对相应重标定后特征和所述原始特征进行融合,得到目标动态区域特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春工业大学,其通讯地址为:130000 吉林省长春市延安大路17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励