免样本通用计数
我们提出了一个新颖的互动式无类别对象计数框架,其中人类用户可以交互地提供反馈以提高计数器的准确性。我们的框架包括两个主要组成部分:一个用户友好的可视化工具来收集反馈,以及一个高效的机制来整合它。
Sep, 2023
零样本目标计数 (ZSC) 是一种新的设置,只需类名作为测试时间的输入。我们提出了找到几个目标裁剪样本并将其用作计数示例的方法,该方法消除了对人工注释者的需求并实现了自动化操作。通过使用大型语言 - 视觉模型构建类原型,我们选择包含目标对象的补丁,同时使用排名模型评估每个补丁的计数误差并选择最合适的示例用于计数。在最近的类别无关计数数据集 FSC-147 上的实验结果验证了我们方法的有效性。
Sep, 2023
本文提出了一种能够在不同对象类别上通用计数的模型,将计数问题转化为匹配问题,利用图像自相似性和丰富的标注视频数据进行训练,并使用适配器模块实现对模型的快速定制,获得了在细胞,汽车和人群计数数据集上具有竞争力和领先水平的表现。
Nov, 2018
本文提出了零样本目标计数(ZSC)这样一种新的设置,该计数系统不需要在循环中进行人工注释,并且可以自动运行。该方法首先构造一个类原型来选择可能包含感兴趣对象即类相关块的补丁,并引入一种可以定量衡量任意补丁作为计数示例的适宜程度的模型,通过将该模型应用于所有候选补丁,可以选择最合适的补丁作为计数示例,实验结果验证了方法的有效性。
Mar, 2023
使用第一个多类别、无类型先验的计数数据集(MCAC)和一个无类型先验的盲计数器(ABC123),该方法可以在训练或推断过程中同时计数多种类型的对象,不需要使用对象示例。ABC123 在 MCAC 上的性能优于现有方法,也适用于 FSC-147,这是一个标准的无类型计数数据集。
Sep, 2023
不需要训练的前提下,本研究提出了一种直接的解决方案,通过利用预先存在的基础模型进行实例级分割,通过四项关键技术的结合,实现了性能的显著提升,与基于训练的方法相媲美。
Mar, 2024
本研究提出了 Counting Transformer (CounTR) 用于实现对任意语义类别的目标进行计数,并采用两阶段的训练策略进行无监督预训练和有监督微调,通过综合评估获得了当前最先进的零样本和少样本计数结果,并使用大规模计数基准进行了彻底的消融研究。
Aug, 2022
利用文本到图像的潜在扩散模型 (LDMs),本研究介绍了一种无监督的排序方法,通过借助生成的计数数据,对任意类型的对象进行可靠计数,该方法优于其他无监督和少样本方法,不受特定对象类别计数数据的限制。
Mar, 2024
通过深入研究语言引导示例学习,论文提出了一种新颖的 ExpressCount,用于改进零样本物体计数。通过语言导向的示例感知器和下游视觉零样本计数管道构成的 ExpressCount,在寻找细粒度特征方面表现出色,充分利用了来自大型语言模型的丰富语义先验知识,并显著提升了任意类别的零样本学习能力,从而为发展和验证基于语言的计数模型开辟了新的途径。大量实验证明了 ExpressCount 的最先进性能,甚至展示了与部分特定类别计数模型相媲美的准确性。
Feb, 2024