中山大学郑慧诚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种基于类别感知特征聚合的视频目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114612820B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210199529.5,技术领域涉及:G06V20/40;该发明授权一种基于类别感知特征聚合的视频目标检测方法是由郑慧诚;陈蔓薇;樊迪威设计研发完成,并于2022-03-01向国家知识产权局提交的专利申请。
本一种基于类别感知特征聚合的视频目标检测方法在说明书摘要公布了:本发明公开了一种基于类别感知特征聚合的视频目标检测方法,包括:检测主干ResNet‑101对视频帧进行特征提取,获得高层语义信息;利用可形变卷积进行亚像素级的特征对齐,随后使用区域生成网络RPN为每一帧生成目标候选框;使用候选框分类模块对生成的候选框进行分类操作,后续仅对具有相同类标签的候选框进行特征聚合;在进行类别感知特征聚合时,使用广范围逐层递进特征聚合模块进行双向且逐层递进的候选框层级的特征聚合操作;使用类间关系建模模块对同一帧上的不同类别目标进行空间位置上的关系建模;将聚合后的候选框特征输入到全连接层以进行具体类别判别和目标框位置的回归修正。本发明使得时序信息和空间位置信息都得到充分利用,从而有效提高视频目标的检测性能。
本发明授权一种基于类别感知特征聚合的视频目标检测方法在权利要求书中公布了:1.一种基于类别感知特征聚合的视频目标检测方法,其特征在于,包括:检测主干ResNet-101对视频帧进行特征提取,获得高层语义信息,利用可形变卷积进行亚像素级的特征对齐,随后使用区域生成网络RPN为每一帧生成目标候选框; 使用候选框分类模块对生成的候选框进行分类操作,后续仅对具有相同类标签的候选框进行特征聚合; 在进行类别感知特征聚合时,使用广范围逐层递进特征聚合模块进行双向且逐层递进的候选框层级的特征聚合操作,对于当前帧前、后向计算出的中间结果进行保存并用以更新下一帧计算所使用的支持帧; 使用类间关系建模模块对同一帧上的不同类别目标进行空间位置上的关系建模; 将聚合后的候选框特征输入到全连接层以进行具体类别判别和目标框位置的回归修正; 所述使用候选框分类模块对生成的候选框进行分类操作之前,还包括:通过特征层运动对齐模块对当前帧进行亚像素级细粒度特征对齐,具体为:在可形变对齐中,使用可形变卷积分别将Ft+s、Ft-s、Ft进行逐像素点位置p对齐,其中,Ft代表当前帧特征图,Ft+s、Ft-s代表局部帧特征图,其数学公式表示为: 其中,R={-1,1,-1,0,..,1,1}代表一个3×3卷积核的规则网格,卷积核的权重用w表示,pk代表卷积核中的第k个采样偏移量,输出代表对齐后的特征,Δpk是Ft+s与Ft进行一系列卷积预测出的运动偏移量; 最后,将当前帧和各个局部帧对齐后的特征和进行逐元素相加,得到模块的最终输出Ft′,即当前帧进行亚像素级细粒度特征对齐后的特征; 所述使用广范围逐层递进特征聚合模块进行双向且逐层递进的候选框层级的特征聚合操作,具体为: 对于候选框的聚合,首先需要对候选框间进行关系建模,给定一组候选框集合B={B1,B2,…,Bn},其中每个候选框Bi包含语义和位置信息,假设通过关系建模增强后的候选框特征集合为则由如下公式表示聚合增强过程: 式中,γ·为一般变换函数;Sk,i表示Bk与Bi候选框层级的相似性,其相似性的计算公式如下: 式中,代表边界框Bk与Bi间的语义特征相似度;和ξ为提取边界框语义特征的网络结构;⊙为点积操作;gk,i为边界框Bk与Bi的几何相似度,其具体计算公式如下: 式中,为一般变换函数;δ为位置嵌入操作,将原始的低维几何相似度gk,i嵌入到深度检测网络的高维表示中,以边界框Bi为例,其几何信息表示为:Bi=xi,yi,wi,hi,xi,yi为边界框Bi的边框中心坐标,wi,hi分别代表边界框Bi的宽和高。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励