Jul, 2024

BiasDora:探索视觉语言模型中隐藏的偏见关联

TL;DR通过检测视觉语言模型(VLMs)上的隐藏、隐含性关联,系统地探索多元的输入和输出模式,揭示存在于九个偏见维度上的细微和极端偏见,从而填补了现有方法的不足,发现通常不被现有方法识别到的隐秘和极端偏见,同时公开了关联数据集(Dora)。