Apr, 2023

通过鲁棒性分析和基本问题链的上下文学习,提高视觉问答模型

TL;DR本文研究了深度神经网络在视觉问答(VQA)任务中的鲁棒性,提出了一种利用基本问题作为噪声来评估 VQA 模型鲁棒性的新方法,并提出了一种新的鲁棒性度量,R_score 和两个基础问题数据集来标准化 VQA 模型鲁棒性分析。实验结果表明,该方法能有效地分析 VQA 模型的鲁棒性,并且基于一系列基本问题的上下文学习可以提高模型的准确性。