Jun, 2024

SLANT: 虚假标志分析工具

TL;DR在线内容中存在许多标志,这些标志广泛应用于用于预训练视觉语言模型的大量网络抓取的数据集中。通过开发了一个工具集SLANT,我们发现一些标志确实会导致虚假的错误预测。SLANT的标志可被视为对基础模型的有效攻击,为了应对这一威胁,我们还提供了两种有效的缓解策略。