SQLNet：用于少样本类别无关计数的尺度调制查询和定位网络

Nov, 2023

SQLNet：用于少样本类别无关计数的尺度调制查询和定位网络

SQLNet: Scale-Modulated Query and Localization Network for Few-Shot Class-Agnostic Counting

Hefeng Wu, Yandong Chen, Lingbo Liu, Tianshui Chen, Keze Wang...

TL;DR通过局部化基础的类别无关计数方法，本研究提出了一种新的基于尺度调节的查询和定位网络（SQLNet），可以准确定位并预测每个目标的大致尺寸，以实现有效的计数；SQLNet 在流行的类别无关计数基准任务上表现优异，不仅在计数准确度上优于最先进的方法，还在定位和边界框生成方面表现出色。

Abstract

The class-agnostic counting (CAC) task has recently been proposed to solve the problem of counting all objects of an arbitrary class with several exemplars given in the input image. To address this challenging task, existing leading methods all resort to →

class-agnostic counting density map regression localization-based cac approach scale-modulated query and localization network (sqlnet)object locations

发现论文，激发创造

学习空间相似度分布用于小样本目标计数

我们提出了一种网络学习的空间相似度分布 (SSD) 方法，用于少样本目标计数，该方法在保留样本特征的空间结构的同时，计算查询特征与样本特征之间的四维相似度金字塔，从而捕捉了四维相似度空间中每个点的完整分布信息，同时利用相似性金字塔上的高效中心轴四维卷积将不同的相似度分布映射到不同的预测密度值，以获得准确的计数。我们还引入了特征交叉增强 (FCE) 模块来改进查询和样本特征的准确性，该方法在多个数据集上表现优于现有方法，包括 FSC-147 和 CARPK。

May, 2024

用于人群计数的多尺度注意力网络

提出了一种使用多分支尺度感知注意力网络、卷积神经网络、软注意力机制、尺度感知损失函数等方法，在 4 个不同的人群计数数据集上实现了最先进的效果，平均减少 25% 的误差。

Jan, 2019

具有注释错误修正的尺度感知人群计数网络

提出了一种 “尺度感知” 人群计数网络 (SACC-Net)，通过引入具有纠正噪声注释能力的空间变化高斯分布来同时建模标签错误和尺度变化，从而生成细粒度的人群密度热力图，进而实现优越的人群计数准确性。

Dec, 2023

尺度变化和孤立聚类下的图像人群计数

本研究提出了一种名为 SACANet 的新型尺度自适应、具有长程上下文感知能力的网络，用于解决高度拥挤、尺度变化大且存在多个孤立集群的人群计数问题，并且在测试中表现出更高的准确性和更低的平均绝对误差。

Sep, 2019

基于伪标记语义分割的多类目标计数学习

本文提出了一种基于范例的分割模型，用于对多类图像进行对象计数，解决了当前多类对象计数模型的主要问题，并介绍了两个新的测试基准，在这些基准上，我们的方法显示出了显着的优势。

Jul, 2023

表示、比较和学习：基于相似度意识的类别不可知计数框架

本研究提出了一个相似性感知的类不可知计数 (CAC) 框架，它同时学习了特征表示和相似度度量，并通过一个叫做 BMNet 的基线和一个叫做 BMNet + 的扩展模型对其进行了实例化，以 FSC147 数据集为实验基础，证明了该模型显著优于现有 CAC 方法。

Mar, 2022

通过语言引导的模板学习提升零样本计数

通过深入研究语言引导示例学习，论文提出了一种新颖的 ExpressCount，用于改进零样本物体计数。通过语言导向的示例感知器和下游视觉零样本计数管道构成的 ExpressCount，在寻找细粒度特征方面表现出色，充分利用了来自大型语言模型的丰富语义先验知识，并显著提升了任意类别的零样本学习能力，从而为发展和验证基于语言的计数模型开辟了新的途径。大量实验证明了 ExpressCount 的最先进性能，甚至展示了与部分特定类别计数模型相媲美的准确性。

Feb, 2024

训练无关的类别不可知计数的简单而有效的基线

不需要训练的前提下，本研究提出了一种直接的解决方案，通过利用预先存在的基础模型进行实例级分割，通过四项关键技术的结合，实现了性能的显著提升，与基于训练的方法相媲美。

Mar, 2024

NAS-Count: 基于密度计数的神经结构搜索

本文利用神经网络结构搜索技术设计了自动的编译 - 解码器架构，Automatic Multi-Scale Network (AMSNet)，并使用 Scale Pyramid Pooling Loss 优化，解决了像素级隔离问题和多尺度信息的监督，从而在人群计数方面表现出最优异的性能。

Feb, 2020

现成的视觉 Transformer 模型：针对少样本类别无关计数的出乎意料的基线

本文提出一种使用预训练的 Vision Transformer（ViT）的解决方案，实现了 Class-Agnostic Counting（CAC），并将其称为 CACViT。实验结果表明，CACViT 在 FSC147 和 CARPK 数据集上均具有很强的鲁棒性和高效性，相较于其他现有的类别无关计数方法减少了 23.60% 的误差。

May, 2023