Nov, 2020

从词汇扰动中学习,以实现一致的视觉问答

TL;DR本文提出了一种使用模块化网络来改善视觉问答模型鲁棒性的方法,以及提出了一个包含大规模语言资源的低成本基准测试,我们的结果表明,对于 VQA 模型的训练和正则化,控制下的语言扰动是一种有用的但当前未充分利用的工具。