Apr, 2024

利用大型语言模型演变可解释的视觉分类器

TL;DR通过演化搜索算法和大语言模型的上下文学习能力,我们提出了一种能够发现解释性又具有辨识性的用于视觉识别的属性集合的新方法,并在五个细粒度的 iNaturalist 数据集上比最先进的基准方法提高了 18.4%,在两个 KikiBouba 数据集上提高了 22.2%。