本论文利用 MNIST 数据集通过训练 counting convolutional neural network 来探究卷积神经网络中数字特征的表示学习,实现对于行人计数场景的初步探索。
May, 2015
该研究提出一种新的用于在自然场景中进行物体类别计数的方法,利用人类视觉的子数能力进行参考,能够显著提高物体类别计数的准确性,并在视觉问题回答中应用了这种方法。
Apr, 2016
本文提出一种使用深度神经网络的方法,对数字图像中的对象进行自动计数和定位,相对于现有方法,其平均误差率有 20% 的相对改进。
Mar, 2017
本文提出了一种基于图像级别监督学习实现常见物体计数的方法,该方法可以同时提供全局物体计数和物体实例的空间分布,并通过构建对象类别密度映射来实现。作者的方法在PASCAL VOC和COCO数据集上进行了全面实验,表现出了优异的性能。
Mar, 2019
本文提出了一种基于点标注的目标计数方法,以构建更好的密度图作为监督信号,同时将点标注视为更多用途的监督信号,从而提高了计数的准确性。
该研究旨在通过引入增强方法和前景蒸馏,以提高基于图像的计数任务的性能。作者在多个数据集上展示了该方法的有效性。
Jun, 2023
本文提出了一种基于范例的分割模型,用于对多类图像进行对象计数,解决了当前多类对象计数模型的主要问题,并介绍了两个新的测试基准,在这些基准上,我们的方法显示出了显着的优势。
Jul, 2023
基于检测的PseCo框架将SAM和CLIP结合起来,实现了对少样本和零样本的准确目标计数,通过点定位、分割和计数等步骤解决了效率和小物体区分等难题。
Nov, 2023
TFCounter是一种基于无需训练的类别不可知目标计数器,通过在大规模基础模型中的基本元素的级联构成一个即时上下文感知的计数框架,它采用双提示系统来识别多种形状、外观和大小不同的物体,并引入了一种创新的上下文感知相似度模块以提高在杂乱场景中的准确性,并通过实验证明了其在跨领域普适性方面的优越性。
Mar, 2024
本研究针对基于点监督的学习中由于标注与未标注像素的不平衡所导致的物体计数与定位问题,提出了一种新颖的CeDiRNet方法。该方法通过密集回归指向最近物体中心的方向,提高了每个中心点的支持,从而在六个不同数据集上展现出优于现有方法的性能,具有显著的应用潜力。
Aug, 2024