- 基于辅助点引导的点估计人群计数和定位的改进
使用辅助点导引和点匹配的策略来改善人群计数和定位方法的不稳定性,通过自适应特征提取在不同的人群场景中增强模型的鲁棒性和准确性。
- VMambaCC:一种用于人群计数的可视化状态空间模型
Visual Mamba(VMamba)是一种深度学习模型,具有较低的计算复杂性和全局感受野,成功应用于图像分类和检测。为了扩展其应用领域,我们将 VMamba 应用于人群计数,并提出了一种新颖的 VMambaCC(VMamba 人群计数) - 基于密度引导的时间注意力变换器用于水下视频中无法分辨物体的计数
提出了一个大规模数据集 YoutubeFish-35,在该数据集上评估了三种主流的密集物体计数方法,并提出了一种新的强基线方法 TransVidCount,该方法在 YoutubeFish-35 数据集上具有最先进的性能,可有效处理不可辨别 - 自适应分辨率的强鲁棒无监督众筹计数和定位
利用自适应分辨率 SEEM 模型和高斯混合模型,结合鲁棒损失函数和迭代生成伪标签方法,提出了一种简单而有效的无监督众数计数方法,可在无标记数据的情况下实现最佳性能,适用于无标记数据的众数计数任务。
- 基于扩散的数据增强用于目标计数问题
使用扩散模型生成的合成数据对深度学习方法在人群计数方面进行增强,减小了真实数据有限导致的过拟合问题,该方法在多个数据集上表现出了显著的性能提升。
- 众筹计数的课程 -- 值得吗?
本研究通过 112 个实验证明,课程学习(Curriculum Learning)在使用密度估计方法进行人群计数时,可提高模型学习性能和收敛时间。
- 基于 Pix2Pix GAN 的多模态人群计数
本文提出使用生成对抗网络(GANs)从彩色(RGB)图像自动生成热红外(TIR)图像,并同时使用两者训练人群计数模型以提高精确度。在多个人群计数模型和基准人群数据集上进行的实验证明了显著的精确度提升。
- 一种用于资源受限人群计数的轻量级特征融合架构
轻量级模型在人群计数中具有可靠的计算效率和性能,并通过比较研究展现其有效性。
- AAAIGramformer: 通过图模态变换器学习人群计数
提出了一种名为 Gramformer 的图模块化 Transformer 方法,解决了传统 Transformer 在人群计数中存在的同质化关注问题,并通过引入注意图和中心性编码的方案,增强了网络的性能和竞争力。
- FGENet: 拥挤人群数量的细粒度提取网络
提出了一种称为 Fine-Grained Extraction Network(FGENet)的端到端模型,直接学习表示个体精确定位的原始坐标,通过引入 Fine-Grained Feature Pyramid(FGFP)来融合特征图并使用 - 具有注释错误修正的尺度感知人群计数网络
提出了一种 “尺度感知” 人群计数网络 (SACC-Net),通过引入具有纠正噪声注释能力的空间变化高斯分布来同时建模标签错误和尺度变化,从而生成细粒度的人群密度热力图,进而实现优越的人群计数准确性。
- 回归器 - 分割器相互提示学习用于人群计数
通过相互提示学习,减少注释变异对模型精确度的影响,提高人群计数的准确性。
- 学习用于人群计数的判别特征
针对高度拥挤区域中的人群计数模型所面临的定位能力差和难以区分前景与背景的问题,我们提出了一种学习判别特征的框架,其中包括一个掩蔽特征预测模块(MPM)和一个监督的像素级对比学习模块(CLM),以改进模型的定位能力和区分前景与背景的能力。这些 - 利用深度神经网络和各向异性高斯核计算海牛聚集数量
基于深度学习的人群计数方法采用各种深度神经网络和各向异性高斯核(Anisotropic Gaussian Kernel)来准确计算区域内海牛的数量,尤其适用于复杂背景环境下聚集的海牛。
- SYRAC: 合成、排序和计数
使用潜在扩散模型生成合成数据,通过排名图像对进行预训练,并使用人群数量特征对噪声合成图像拟合线性层,从而实现无监督人群计数的最新结果。
- ICCV点查询四叉树用于人群计数、定位与更多
我们介绍了一种新的计数模型,称为 Point quEry Transformer(PET),它通过数据相关的四叉树分割实现可分解的点查询,使得稀疏和稠密区域的动态处理成为可能。我们展示了 PET 在众多与人群相关的任务上的应用,并报道了最先 - DAOT:领域无关对齐的最优传输在领域自适应人群计数中的应用
这篇论文介绍了一种处理跨领域人群计数中领域内差异的领域无关因素的方法,通过实施三个步骤的 Domain-agnostically Aligned Optimal Transport (DAOT) 策略,对不同领域之间的差异进行优化对齐,并证 - 恶劣天气中的人群计数
本篇文章提出了一种强大的应对恶劣天气情景下人群计数问题的方法,该方法利用图像特征和自适应查询进行计数并依据输入图像的降解进行优化,实验结果表明该方法在不同天气类型下对基准数据集中的人群计数问题有效。
- 迭代缩放与细化实现精准千万人群计数
本文介绍了一种名为 GigaZoom 的方法,它通过迭代地放大图像的密集区域并用更细的细节来改进更粗的密度图,从而实现了千兆像素人群计数的最先进精度,并将下一个最佳方法的精度提高了 42%。
- 现有的多模态人群计数数据集可能会导致实际应用中无法实现的期望
本文探讨了多模型与单模型在人群计数方面的差异,并发现现有数据集存在热成像的偏见,提出了一个潜在数据集的标准,以回答多模型是否在人群计数方面表现更好的问题。