Dec, 2020

探究视觉与语言预训练模型的鲁棒性

TL;DR通过对现有的预训练模型进行全面评估和改进,本研究提出了一种名为 Mango 的方法,在嵌入空间中学习多模态对抗性噪声生成器,使得预训练的视觉 - 语言模型的鲁棒性得到了大幅度提升,并在七项鲁棒性测试中创造了新的最高水平。