Dec, 2019

走向因果 VQA:通过不变量和协变语义编辑揭示和减少虚假相关

TL;DR本文讨论了一种新的方法,可以分析和衡量 Visual Question Answering 模型的稳健性,同时提出了使模型更具鲁棒性的方法,包括自动化的语义图像操作,和测试模型预测的一致性,生成合成数据来解决这些问题,实验结果表明,通过我们编辑的数据,模型的不一致预测显著减少,对于各种有挑战性的计数问题,我们对三种不同类型的最先进的 VQA 模型进行了分析,最终结果同样能够很好地应用于实际误差案例中,从而实现整体性能的提高。