买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨师范大学
申请日:2024-01-11
公开(公告)日:2024-08-30
公开(公告)号:CN117994720B
专利技术分类:..监视或监测活动,例如 用于识别可疑物体(识别微观物体 G06V20/69)[2022.01]
专利摘要:本发明涉及人群密度估计,尤其涉及一种基于深度学习的人群密度估计方法。本发明通过使用深度学习技术进行人群密度估计,通过收集图像数据集并进行预处理,利用ResNet网络模型提取人群特征,再使用U‑net结构生成人群密度图。通过设计损失函数进行训练得到第二ACSCP模型,并使用该模型处理新的待处理图像,输出第三密度图。最后使用均方根误差评估第三密度图的准确性。这种基于深度学习的人群密度估计方法通过预处理图像数据、利用深度网络提取人群特征和生成人群密度图、设计合理的损失函数、训练和评估模型,能够以高准确性估计人群密度,同时还能改善数据质量、优化模型结构和参数,并提供客观的评估标准。
专利权项:1.一种基于深度学习的人群密度估计方法,其特征在于,包括以下步骤:S1、收集图像数据集,对图像数据集中的若干待处理图像进行预处理操作,每个所述待处理图像均包含人群;S2、使用ResNet网络模型从任意待处理图像中提取人群的特征,以形成特征图;S3、使用U-net结构生成网络将所述特征图转换为人群密度图;S4、设计损失函数,以得到均方误差损失函数;S5、使用70%的所述人群密度图作为训练数据集和所述均方误差损失函数对第一ACSCP模型进行训练,以得到第二ACSCP模型;S6、将新的待处理图像经过所述S2和所述S3的步骤,得到新的待处理图像对应的人群密度图;S7、将所述新的待处理图像对应的人群密度图输入所述第二ACSCP模型中,所述第二ACSCP模型输出第三密度图;S8、使用均方根误差对所述第三密度图进行评估;所述S3步骤包括以下步骤:S31、准备一组带有标注人群密度图的训练样本,每个训练样本包括一个所述特征图和对应的所述人群密度图;S32、构建一个包含编码器和解码器的U-net结构生成网络;S33、定义一个均方误差损失函数;S34、使用准备好的训练数据和定义的损失函数,通过反向传播算法,优化网络参数对所述U-net结构生成网络进行训练;S35、在训练完成后,使用训练好的所述U-net结构生成网络,将特征图输入所述U-net结构生成网络,通过前向传播计算得到人群密度图;所述S5步骤包括以下步骤:S51、从所述人群密度图中选择70%的样本作为训练数据,并进行归一化、平衡样本分数据预处理;S52、对ResNet网络模型和U-net结构生成网络进行权重和偏置的初始化;S53、选择Adam优化器并使用随机初始化的学习率、动量和权重衰减超参数;S54、使用训练数据集中的图像对所述第一ACSCP模型进行迭代训练,并使用最小化均方误差损失函数来调整所述学习率、动量和权重衰减超参数,以得到第二ACSCP模型;S55、重复执行步骤S54,直到达到最大迭代次数;所述S54步骤中包括以下步骤:S541、将所述训练数据集中的图像通过ResNet网络模型获取特征图,然后使用U-net结构生成网络将所述特征图转换为人群密度图;S542、根据包含所述待处理图像中的人头数量和二维坐标的标注文件中的人头位置信息,在图像上将对应位置的像素点置为1,其余像素点置为0,以得到二值图像,使用高斯核函数对二值图像进行卷积,以得到真实密度图,通过对比所述人群密度图和所述真实密度图,计算均方误差损失函数的值;S543、根据损失函数的值,使用反向传播算法计算梯度,并更新模型的参数;S544、根据梯度信息,使用所述Adam优化器更新学习率、动量和权重衰减超参数的值;S545、重复执行步骤S541到S544,直到达到预定的迭代次数为止;所述S6步骤包括以下步骤:S61、输入所述特征图通过编码器部分进行多次的卷积操作,利用不同尺度的卷积核提取图像特征;S62、在编码器部分的每个卷积层后,进行下采样操作以增加感受野和减少特征图的尺寸;S63、将编码器的最后一层得到的特征图传递给解码器部分;S64、解码器部分逐步进行上采样操作,将特征图的尺寸恢复到原始输入图像的尺寸;S65、在上采样的过程中,将编码器中的特征图与解码器中的特征图进行融合,结合不同尺度的信息;S66、通过一层卷积层将解码器的输出转换为与输入图像尺寸相同的表示图像中不同区域的人群密度图;所述S7步骤包括以下步骤:S71、将生成的新的待处理图像对应的人群密度图输入所述第二ACSCP模型中进行前向传播,以获取第二密度图;S72、将人群密度图中低于或高于某个阈值的像素点置为0,以去除噪声;使用高斯滤波器对所述第二密度图进行平滑处理,以去除噪声和不规则的细节;使用直方图均衡化和增强对比度对所述第二密度图进行处理,以获得修正后的第三密度图;所述S8步骤包括以下步骤:S81、根据包含所述新的待处理图像中的人头数量和二维坐标的ACSCP标注文件中的人头位置信息,在图像上将对应位置的像素点置为1,其余像素点置为0,以得到二值图像,使用高斯核函数对二值图像进行卷积,以得到真实ACSCP密度图;S82、计算每个所述真实ACSCP密度图和所述第三密度图中每个像素值之间的差异,并求取均方根误差,表示模型的人群密度估计精度,具体计算公式如下:均方根误差=,其中,sum表示求和运算,N表示像素的总数;S83、计算均方根误差的平均值作为评估模型性能的指标,若所述均方根误差的平均值小于等于预设的平均阈值,则评估为密度估计结果与真实情况一致。
百度查询: 哈尔滨师范大学 基于深度学习的人群密度估计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。