实时无人机监督下的人群计数统一多任务学习框架
本文提出了一种基于 CNN 的端到端级联网络方法,用于共同学习人群计数分类和密度图估计,实现高精度密度图的生成,并在公开数据集上取得了良好的效果。
Jul, 2017
本文介绍了一种新的人群数据集 (DLR-ACD),并提出了一种基于 VGG-16 网络和多分辨率的编码器 - 解码器卷积神经网络 (MRCNet) 来对其进行准确的人群计数和密度图估计。结果表明,该方法在估计空中和基于 CCTV 的图像的人群计数和密度图方面优于现有的人群计数方法。
Sep, 2019
本研究提出一种新颖的方法解决在给定密集人群图像中计数、密度图估计和人物定位的问题,成果在新数据集上的表现大幅领先于现有的深度 CNN 网络。
Aug, 2018
提出了一种使用多分支尺度感知注意力网络、卷积神经网络、软注意力机制、尺度感知损失函数等方法,在 4 个不同的人群计数数据集上实现了最先进的效果,平均减少 25% 的误差。
Jan, 2019
本文研究了人群计数的问题,并提出了新的方法,通过引入局部计数映射(LCM)等新的训练目标,以及采用混合回归框架的三个模块(SAM, MRM 和 ASIM)来进一步提高人群估计的精度。
May, 2020
本研究提出了一种基于三维特征融合和场景密度图的多视角人群计数方法,并探索了在二维视图中的投影一致性,结果表明该方法在三个多视角计数数据集上表现更优或相当于现有最先进方法。
Mar, 2020
通过新构建的无人机大规模数据集 DroneCrowd,该研究设计了一种名为 STNNet 的算法,旨在解决密集人群中的物体检测、跟踪和计数。该算法借助空间 - 时间领域中下文信息处理相机拍摄的无人机视频,并通过邻域上下文丢失函数解决密集人群中的物体检测跟踪问题,并取得最先进技术方案的竞争结果。
May, 2021
本文提出了一种多任务方法来统一框架中进行人群计数和人员定位,通过学习编码人群图像的多尺度表示并将它们融合,我们的模型比相对较流行的基于密度的方法使用点监督来精确地识别人群位置,并在两个流行的分别是 ShanghaiTech A 和 B 的人群计数数据集上测试了我们的模型,展示了我们的方法在人群计数和定位任务上的强效果,分别在 ShanghaiTech A 和 B 上具有 110.7 和 15.0 的 MSE 量和 0.71 和 0.75 的 AP 量,我们的详细消融实验显示了多尺度方法的影响以及我们网络中嵌入的融合模块的有效性。
Feb, 2022
针对高度拥挤区域中的人群计数模型所面临的定位能力差和难以区分前景与背景的问题,我们提出了一种学习判别特征的框架,其中包括一个掩蔽特征预测模块(MPM)和一个监督的像素级对比学习模块(CLM),以改进模型的定位能力和区分前景与背景的能力。这些提出的模块对于密集场景或混乱环境中的精确定位等各种计算机视觉任务都有潜在的性能提升效果。
Nov, 2023
该研究提出了一种新的半监督计数方法,使用可学习的密度机构来将已识别的前景区域特征与其对应的密度子类(代理)接近,并将背景特征推开。通过密度导向的对比损失巩固骨干特征提取器,再使用变换器结构构建回归头进一步优化前景特征。提供了高效的噪声压制损失以最小化注释噪声的负面影响。在四个具有挑战性的人群计数数据集上的广泛实验表明,我们的方法比最先进的半监督计数方法具有更优越的性能。
Sep, 2022