Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京工业大学张勇获国家专利权

北京工业大学张勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京工业大学申请的专利一种基于多尺度动态图卷积的弱监督人群计数方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115937758B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210859858.8,技术领域涉及:G06V20/52;该发明授权一种基于多尺度动态图卷积的弱监督人群计数方法是由张勇;苗壮壮;孙艳丰;胡永利;尹宝才设计研发完成,并于2022-07-21向国家知识产权局提交的专利申请。

一种基于多尺度动态图卷积的弱监督人群计数方法在说明书摘要公布了:一种基于多尺度动态图卷积网络的弱监督人群计数方法属于人群计数在公共安全、城市规划和交通调度等领域。由于交通场景的复杂性和多样性,对大量人群进行点级标注非常困难,而且需要大量人力。弱监督人群计数更适合这些场景,因为它们只需要计数级别的注释。现有的弱监督人群计数忽略了交叉距离人群密度分布的不均匀性和多尺度人群头部,无法获得与全监督人群计数方法相似的准确计数结果。本发明提出了一种多级区域动态图卷积模块来提取不同人群区域之间的内在关系,从而学习动态区域得分,进而优化区域特征表示,还设计了一个粗粒度的多级特征融合模块来提取多尺度人群头部信息。本发明具有较高的回归精度的端到端人群计数能力。

本发明授权一种基于多尺度动态图卷积的弱监督人群计数方法在权利要求书中公布了:1.基于多尺度动态图卷积的弱监督人群计数方法,其特征在于,包括以下步骤: 步骤1:数据预处理 首先使用四个经典的人群计数数据库来构建输入样本点:a将图像的大小调整为1152×768或768×1152;b然后将每张图像分割为6张384×384的图像块;c对数据集采用随机数据增强; 步骤2:模型训练 步骤2.1模型参数设定 对于特征提取主干网络,采用Swin-L模型,并利用ImageNet-22K的预训练参数作为初始参数来加快模型的收敛速度;训练批处理参数的大小为30;学习率最初设置为10-5,在100个批次后衰减到10-6;训练总批次设置为200; 在模型的评估阶段,使用MSE和MAE作为度量标准,计算公式如下: 其中,N为图像数,Pi和Gi分别表示预测值和真实值;平均绝对误差MAE是目标值与预测值之间的差值的绝对值之和;它只测量预测值误差的平均值;均方误差MSE是最常用的回归损失函数;它是通过计算预测值与目标值之间的距离的平方来计算的; 步骤2.2Swin-Transformer主干网络特征提取 对于一张图像X∈R384*384*3,第一维度和第二维度表示特征图的长和宽,第三维度代表特征图的通道数;要想输入到Swin-Transformer主干网络,首先需要将二维图像信息转换为符合主干网络输入的一维序列信息;因此,特征提取主干网络中包括图像块分区和图像块合并的操作,能够解决输入的问题;值得注意的是,此特征提取主干网络包含四个阶段,每个阶段都降低了输入特征图的分辨率,并像卷积神经网络一样扩展了特征图的感受野;因此,此步骤能够提取四种不同尺度的图像特征图即X1∈R96*96*192、X2∈R48*48*384、X3∈R24*24*768、X4∈R12*12*1536; 步骤2.3多尺度特征融合 基于步骤2.2输出的多尺度图像特征图,将融合主干网络输出的四种不同尺度的特征图;具体来说,融合X1、X2、X3、X4特征,使得最后输出的特征能够包含多尺度的信息;选择原图像的116即24*24作为特征图输出的最佳分辨率;因此X3不需要改变大小,X1、X2使用全局平均池化操作将分辨率降低到24*24;然而X4则利用双线性上采样操作将分辨率调整为24*24;最后,针对X1、X2、X3、X4都使用利用卷积核为3*3的2D卷积在特征图上滑动来消除平均池化和上采样对特征图产生的消极效应并且统一特征图的通道数为384;最后,将多尺度的特征图相加融合为最终包含多尺度信息的特征表示Z∈R24*24*384; 步骤2.4特征增强 特征增强包含多尺度空洞卷积模块和多尺度全局池化模块;多尺度空洞卷积模块包含四个通道,其中包含三个空洞卷积通道和一个额外的普通卷积通道,此模块通过不同空洞率的卷积能够提取大的感受野并且能够学习到图像中不同尺度的人群信息;具体来说,三个空洞卷积通道分别采用空洞率为1、空洞率为2、空洞率为3的空洞卷积层对步骤2.3输出的特征表示Z进行处理,输出三种具有不同大小感受野的特征图Z1∈R24*24*384,Z2∈R24*24*384,Z3∈R24*24*384;额外的普通卷积通道对特征图进行普通卷积输出为Z4∈R24*24*1152;最后首先将Z1、Z2、Z3在特征维度进行拼接,增加特征图中每个像素点的信息输出为Z123∈R24*24*1152,最后将此特征图与Z4进行像素级别的相加输出为M∈R24*24*1152;多级全局池化模块由三个通道组成:池化大小为12×12,池化大小为6×6,池化大小为3×3;用不同尺度的池化层去提取多尺度的区域计数特征以解决单一尺度区域可能会出现人群分割的消极问题;在每个池化层后,都有一个卷积核为3*3的2D卷积在特征图上滑动来消除平均池化对特征图产生的消极效应并且统一特征图的通道数为64;需要指出的是,每个卷积层之后都有一个批处理归一化BN层和一个ReLU激活函数;最后步骤2.4的输出为不同尺度的区域特征M1∈R12*12*64、M2∈R6*6*64、M3∈R3*3*64; 步骤2.5基于多尺度区域动态图卷积的计数回归 针对多尺度的区域特征表示,首先利用卷积核大小为1*1的2D卷积减低特征表示到低维空间,此时得到了人群区域的地维特征图表示;用Sigmoid来将低维特征映射到非线性分数水平;通过Softmax得到一个每个区域的计数分数;使用区域计数分数来计算相对距离,并利用KNN来获得每个区域的相似的人群区域;具体来说,首先利用1D卷积对步骤2.4的输出进行特征降维为M11∈R12*12*1、M22∈R6*6*1、M33∈R3*3*1;然后再通过sigmoid激活函数和Softmax层得到每个区域的计数分数M11f∈R144、M22f∈R36、M33f∈R9;利用每个区域计数分数相减能够计算区域间的相对距离,相对距离越近特征越相似;其中,M11、M22、M33分别取每个区域相对距离最近的12、6、3个区域作为最近邻相似人群区域;因此,能够根据相对距离得到每个区域特征最近邻相似的人群区域,利用邻接矩阵的形式来表达这种区域间特征相似的关系;将步骤2.4输出的多尺度区域特征和邻接矩阵输入到叠加的两层图卷积网络中;最后,将图卷积网络输出的特征Q1∈R12*12*64、Q2∈R6*6*64、Q3∈R3*3*64输入到叠加的MLP层中,对图像中每个区域的计数结果进行回归获得Q11∈R12*12、Q22∈R6*6、Q33∈R3*3;将所有区域的计数相加,并对不同尺度的计数结果取平均,得到该图像最终的计数结果P=Q11+Q22+Q333。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。