Mar, 2024
建模协作者:通过 LLM 工具使用实现最小人力投入的主观视觉分类
Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use
Imad Eddine Toubal, Aditya Avinash, Neil Gordon Alldrin, Jan Dlabal, Wenlei Zhou...
TL;DR通过使用自然语言交互减少人工标记工作量,本研究提出了一个新框架,用于快速定义概念并自动标记训练数据点,从而替代传统的手动分类方法。在 15 个主观概念和 2 个公共图像分类数据集上进行测试,我们的训练模型在敏捷建模以及 ALIGN、CLIP、CuPL 等最新的零样本分类模型以及大型视觉问答模型(如 PaLI-X)之上表现出色。