Feb, 2024

欺骗性提示对多模态语言模型的迷惑程度实证分析

TL;DR通过 Quantum-Bench,我们比较了多种先进模型在对抗伪信息的能力上的表现,并提出了通过增加伪信息以增强模型韧性的建议。