SQLNet:用于少样本类别无关计数的尺度调制查询和定位网络
我们提出了一种网络学习的空间相似度分布 (SSD) 方法,用于少样本目标计数,该方法在保留样本特征的空间结构的同时,计算查询特征与样本特征之间的四维相似度金字塔,从而捕捉了四维相似度空间中每个点的完整分布信息,同时利用相似性金字塔上的高效中心轴四维卷积将不同的相似度分布映射到不同的预测密度值,以获得准确的计数。我们还引入了特征交叉增强 (FCE) 模块来改进查询和样本特征的准确性,该方法在多个数据集上表现优于现有方法,包括 FSC-147 和 CARPK。
May, 2024
提出了一种使用多分支尺度感知注意力网络、卷积神经网络、软注意力机制、尺度感知损失函数等方法,在 4 个不同的人群计数数据集上实现了最先进的效果,平均减少 25% 的误差。
Jan, 2019
提出了一种 “尺度感知” 人群计数网络 (SACC-Net),通过引入具有纠正噪声注释能力的空间变化高斯分布来同时建模标签错误和尺度变化,从而生成细粒度的人群密度热力图,进而实现优越的人群计数准确性。
Dec, 2023
本研究提出了一种名为 SACANet 的新型尺度自适应、具有长程上下文感知能力的网络,用于解决高度拥挤、尺度变化大且存在多个孤立集群的人群计数问题,并且在测试中表现出更高的准确性和更低的平均绝对误差。
Sep, 2019
本文提出了一种基于范例的分割模型,用于对多类图像进行对象计数,解决了当前多类对象计数模型的主要问题,并介绍了两个新的测试基准,在这些基准上,我们的方法显示出了显着的优势。
Jul, 2023
本研究提出了一个相似性感知的类不可知计数 (CAC) 框架,它同时学习了特征表示和相似度度量,并通过一个叫做 BMNet 的基线和一个叫做 BMNet + 的扩展模型对其进行了实例化,以 FSC147 数据集为实验基础,证明了该模型显著优于现有 CAC 方法。
Mar, 2022
通过深入研究语言引导示例学习,论文提出了一种新颖的 ExpressCount,用于改进零样本物体计数。通过语言导向的示例感知器和下游视觉零样本计数管道构成的 ExpressCount,在寻找细粒度特征方面表现出色,充分利用了来自大型语言模型的丰富语义先验知识,并显著提升了任意类别的零样本学习能力,从而为发展和验证基于语言的计数模型开辟了新的途径。大量实验证明了 ExpressCount 的最先进性能,甚至展示了与部分特定类别计数模型相媲美的准确性。
Feb, 2024
不需要训练的前提下,本研究提出了一种直接的解决方案,通过利用预先存在的基础模型进行实例级分割,通过四项关键技术的结合,实现了性能的显著提升,与基于训练的方法相媲美。
Mar, 2024
本文利用神经网络结构搜索技术设计了自动的编译 - 解码器架构,Automatic Multi-Scale Network (AMSNet),并使用 Scale Pyramid Pooling Loss 优化,解决了像素级隔离问题和多尺度信息的监督,从而在人群计数方面表现出最优异的性能。
Feb, 2020
本文提出一种使用预训练的 Vision Transformer(ViT)的解决方案,实现了 Class-Agnostic Counting(CAC),并将其称为 CACViT。实验结果表明,CACViT 在 FSC147 和 CARPK 数据集上均具有很强的鲁棒性和高效性,相较于其他现有的类别无关计数方法减少了 23.60% 的误差。
May, 2023