ICLRJan, 2022

基于语义表示的语言偏差图像分类评估

TL;DR通过引入基于认知科学文献的方法工具,本研究介绍了一项基准测试来评估人工模型的偏差,并使用这个基准测试评估了 CLIP 模型。我们发现,虽然单词嵌入的图像会扭曲 CLIP 模型在不同类别级别上的图像分类,但这种影响不依赖于图像和嵌入单词之间的语义关系,这表明 CLIP 视觉处理中的语义词表示与图像表示不共享。