Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜东南大学何铁军获国家专利权

恭喜东南大学何铁军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜东南大学申请的专利一种基于压缩视频DCT系数的车辆检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114866784B

龙图腾网通过国家知识产权局官网在2025-04-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210411306.0,技术领域涉及:H04N19/625;该发明授权一种基于压缩视频DCT系数的车辆检测方法是由何铁军;李晓港设计研发完成,并于2022-04-19向国家知识产权局提交的专利申请。

一种基于压缩视频DCT系数的车辆检测方法在说明书摘要公布了:本发明公开了一种基于压缩视频DCT系数的车辆检测方法,包括步骤:对压缩码流视频进行提取,并得到所述压缩码流视频对应的第一DCT系数;基于所述第一DCT系数进行预处理,并得到第二DCT系数;构造车辆检测模型;基于开源图像数据集UA‑DETRAC获取图像样本集,再使用所述图像样本集对所述车辆检测模型进行训练,并得到车辆检测网络;基于所述压缩码流视频、所述第二DCT系数和所述车辆检测网络,获取车辆检测结果。本发明利用了压缩格式数据无需完全解码即可获取特征信息的特点,结合深度学,降低了车辆检测模型的复杂度,减少了车辆检测所需算力,并满足边缘计算的要求。

本发明授权一种基于压缩视频DCT系数的车辆检测方法在权利要求书中公布了:1.一种基于压缩视频DCT系数的车辆检测方法,其特征在于,包括如下步骤:S1:对压缩码流视频进行提取,并得到所述压缩码流视频对应的第一DCT系数;S2:针对所述第一DCT系数进行预处理,得到第二DCT系数;S3:构造车辆检测模型;S4:基于开源图像数据集UA-DETRAC获取图像样本集,再使用所述图像样本集对所述车辆检测模型进行训练,并得到车辆检测网络;S5:将所述第二DCT系数输入所述车辆检测网络进行检测,并得到车辆的位置、种类和置信度信息,然后基于所述车辆的位置、种类和置信度信息在解码后的所述压缩码流视频帧中绘制车辆的检测框、种类和置信度,所述车辆的检测框、种类和置信度即为车辆的检测结果;所述压缩码流视频为H.264压缩码流视频;所述步骤S1中,对所述H.264压缩码流视频进行提取,得到所述压缩码流视频对应的第一DCT系数,具体过程包括如下:将所述H.264压缩码流视频的大小转换成416x416;所述H.264压缩码流视频的图像帧包括:I帧、P帧和B帧;使用JM解码器获取所述H.264压缩码流视频I帧的4x4块的残差DCT系数和I帧帧内预测模式下的预测值,再对所述I帧帧内预测模式下的预测值进行4x4块的DCT变换,最后将变换结果跟所述H.264压缩码流视频I帧的4x4块的残差DCT系数相加,得到所述I帧的4x4块的DCT系数;获取所述H.264压缩码流视频P帧和B帧各自的残差DCT系数和各自参考帧的DCT系数,再根据所述P帧和B帧各自参考帧的DCT系数和所述P帧和B帧各自的运动矢量,获取各自参考编码块的位置以及各自参考编码块的DCT系数,基于获取的所述P帧和B帧各自的残差DCT系数、各自参考编码块的位置以及各自参考编码块的DCT系数,得到所述P帧和B帧各自4x4块的DCT系数;所述I帧、P帧和B帧各自4x4块的DCT系数统称为第一DCT系数;根据DCT系数的块空间关系将所述4x4块的第一DCT系数转换为8x8块的第一DCT系数,即得到所述压缩码流视频对应的第一DCT系数;所述步骤S1中,基于获取的所述P帧和B帧各自的残差DCT系数、各自参考编码块的位置以及各自参考编码块的DCT系数,得到所述P帧和B帧各自4x4块的DCT系数的具体过程包括如下:当所述P帧和B帧各自参考编码块位于参考帧像素4的倍数的整数位置时,直接将所述P帧或B帧各自的残差DCT系数与所述P帧和B帧各自参考编码块的DCT系数相加,获得所述P帧和B帧各自4x4块的DCT系数;当所述P帧和B帧各自参考编码块位于不是参考帧像素4的倍数的整数位置时,根据与各自参考编码块相邻、位于参考帧像素4的倍数的整数位置的四个块的DCT系数,获取所述P帧和B帧各自参考编码块的DCT系数,再将所述P帧和B帧各自的残差DCT系数与所述P帧和B帧各自参考编码块的DCT系数分别相加,获得所述P帧和B帧各自4x4块的DCT系数;所述步骤S2中,针对所述第一DCT系数进行预处理,得到第二DCT系数的具体过程包括:剔除所述第一DCT系数中Cb分量和Cr分量的DCT系数,保留所述第一DCT系数中Y分量416x416格式的DCT系数,并将其转换成52x52x64的格式,再将转换格式后的所述DCT系数按照ZigZag进行排序,最后在排序结果中取前24个DCT系数,即为第二DCT系数;所述步骤S3中,构造车辆检测模型的具体过程包括:基于DarkNet-53模型构建主干特征提取网络,所述主干特征提取网络结合残差网络,再通过卷积和残差结构的堆积提取特征,并缩小特征图尺寸;构建基于特征金字塔的回归检测网络,并在52x52,26x26,13x13三个尺度的特征图上检测车辆;确定损失函数,所述损失函数包括:检测框坐标损失、置信度损失和分类损失;所述步骤s4中,所述图像样本集的获取过程包括:将所述开源图像数据集UA-DETRAC中的图片尺寸统一缩放至416x416大小,然后基于Libjpeg库提取压缩格式图像的DCT系数,接着对所述提取到的DCT系数进行处理并输出其Y分量的52x52x24大小的DCT系数,即为图像样本集;所述步骤S4中,使用所述图像样本集对所述车辆检测模型进行训练的具体过程包括:初始化所述车辆检测模型的网络权重,使用正态分布对网络初始权值进行初始化;将所述车辆检测模型的初始学习率设为1e-4,并使用Adam算法在后续训练中得到自适应学习率;使用K-means聚类法根据所述图像样本集的标签数据设置锚框的尺寸,并借鉴YOLOv3的思想,在所述52x52,26x26,13x13三个尺度的特征图上各设置三种尺寸的锚框;设置所述车辆检测模型的参数值:检测类别、batchsize和迭代次数;使用所述图像样本集对所述车辆检测模型进行训练。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。