Nov, 2023

这张图片有几只独角兽?一项用于视觉语言模型的安全评估基准

TL;DR该研究聚焦于 Vision LLMs(VLLMs)在视觉推理中的潜力,从评估性能转移到引入了全面的安全评估套件,包括分布外泛化和对抗鲁棒性。