Mar, 2024

建模协作者:通过 LLM 工具使用实现最小人力投入的主观视觉分类

TL;DR通过使用自然语言交互减少人工标记工作量,本研究提出了一个新框架,用于快速定义概念并自动标记训练数据点,从而替代传统的手动分类方法。在 15 个主观概念和 2 个公共图像分类数据集上进行测试,我们的训练模型在敏捷建模以及 ALIGN、CLIP、CuPL 等最新的零样本分类模型以及大型视觉问答模型(如 PaLI-X)之上表现出色。