Nov, 2020
从词汇扰动中学习,以实现一致的视觉问答
Learning from Lexical Perturbations for Consistent Visual Question Answering
Spencer Whitehead, Hui Wu, Yi Ren Fung, Heng Ji, Rogerio Feris...
TL;DR本文提出了一种使用模块化网络来改善视觉问答模型鲁棒性的方法,以及提出了一个包含大规模语言资源的低成本基准测试,我们的结果表明,对于 VQA 模型的训练和正则化,控制下的语言扰动是一种有用的但当前未充分利用的工具。