Mar, 2024

PEEB:基于部件的图像分类器与可解释与可编辑的语言瓶颈

TL;DR基于 CLIP 的分类器依赖包含文本编码器已知的 {类别名称} 的提示。我们提出了 PEEB - 一种可解释和可编辑的分类器,用于从视觉部分的文本描述符提取类别名称并进行匹配,以计算分类的逻辑得分。在类别名称未知的零样本设置中,PEEB 的性能远远超过 CLIP(准确率提升了约 10 倍)。与基于部分的分类器相比,PEEB 不仅在监督学习设置下达到了最先进水平(准确率达到 88.80%),而且还首次实现了用户编辑类别定义以形成新分类器而无需重新训练。与概念瓶颈模型相比,PEEB 在零样本和监督学习设置下也达到了最先进水平。