Jun, 2021

VQA系统鲁棒吗?通过有针对性的干预测试对增广数据的稳健性

TL;DR通过针对性介入问题的特定属性来改变答案,我们提出了一种新的鲁棒性度量RAD来衡量视觉问题回答系统的广义能力,结果表明,与传统准确性测量不同,RAD可以量化最先进的系统对反事实问题的鲁棒性,揭示了当前视觉问题回答系统的脆弱性。