Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学深圳研究生院刘梦源获国家专利权

北京大学深圳研究生院刘梦源获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学深圳研究生院申请的专利针对低质视频的人体行为识别方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120126221B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510610669.0,技术领域涉及:G06V40/20;该发明授权针对低质视频的人体行为识别方法、装置、设备及介质是由刘梦源;王梓懿;李培铭;丁润伟;张禧瑞;刘洋设计研发完成,并于2025-05-13向国家知识产权局提交的专利申请。

针对低质视频的人体行为识别方法、装置、设备及介质在说明书摘要公布了:本申请公开了一种针对低质视频的人体行为识别方法、装置、设备及介质,所述方法包括视频帧对应的前序帧差异图、后序帧差异图和平均帧差异图;对每帧视频帧对应的前序帧差异图、后序帧差异图以及平均帧差异图进行跨帧语义聚合,以得到每帧视频帧对应的特征表示;基于每帧视频帧对应特征表示确定待识别视频序列的行为标签。本申请先获取前序帧差异图、后序帧差异图以及平均帧差异图来进行帧间噪声抑制,然后基于前序帧差异图、后序帧差异图以及平均帧差异图进行跨帧语义聚合以聚合丰富的时空信息,这样不但可以在保持关键的轮廓信息的前提下减少背景噪声和干扰,而且可以获取到丰富的时空信息,有效提升加密视频中的行为识别准确性。

本发明授权针对低质视频的人体行为识别方法、装置、设备及介质在权利要求书中公布了:1.一种针对低质视频的人体行为识别方法,其特征在于,所述的针对低质视频的人体行为识别方法具体包括: 获取待识别视频序列中的每帧视频帧与其对应的前序视频帧间的前序帧差异图,与其对应的后序视频帧间的后序帧差异图和与所述待识别视频序列的平均帧间的平均帧差异图; 对每帧视频帧对应的前序帧差异图、后序帧差异图以及平均帧差异图进行跨帧语义聚合,以得到每帧视频帧对应的特征表示; 基于待识别视频序列中的每帧视频帧对应特征表示,确定所述待识别视频序列的行为标签; 其中,所述基于待识别视频序列中的每帧视频帧对应特征表示,确定所述待识别视频序列的行为标签具体包括: 获取所述待识别视频序列对应的文本信息,并通过CLIP模型中的文本编码器确定所述文本信息对应的文本表示; 通过CLIP模型中的视频编码器基于所述待识别视频序列中的每帧视频帧对应的特征表示确定高维特征表示,并基于每帧视频帧的高维特征表示确定全局视频表示; 基于所述文本表示以及所述全局视频表示,确定所述待识别视频序列的行为标签; 所述基于所述文本表示以及所述全局视频表示,确定所述待识别视频序列的行为标签具体包括: 将所述文本表示以及所述全局视频表示输入视频特定提示生成器; 通过所述视频特定提示生成器中的自注意力机制捕捉文本表示与全局视频表示间的依赖关联以形成中间文本表示; 通过所述视频特定提示生成器中的前馈网络基于所述中间文本表示和所述全局视频表示确定视频特定提示; 将所述视频特定提示与所述文本表示进行融合,以得到增强文本表示; 计算所述增强文本表示以及所述全局视频表示的相似度,并基于所述相似度确定所述待识别视频序列的行为标签。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学深圳研究生院,其通讯地址为:518071 广东省深圳市南山区西丽大学城北大园区G307;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。