ACLOct, 2021

面向视觉及语言推理的语义分布式鲁棒优化

TL;DR本文提出一种名为 SDRO 的模型无关方法,利用分布式鲁棒优化设置中的一组语言转换,并使用集成技术在推断期间利用这些转换来提高通用性和稳健性。实验表明,该方法可以对视觉和语言模型进行增强,从而在图像(NLVR2)和视频(VIOLIN)上获得性能改善,并展示了对抗性攻击的稳健性。