Jun, 2019
RUBi:减少视觉问答中单模态偏见
RUBi: Reducing Unimodal Biases in Visual Question Answering
Remi Cadene, Corentin Dancette, Hedi Ben-younes, Matthieu Cord, Devi Parikh
TL;DR提出了一种新的学习策略 RUBi,它减少了任何 VQA 模型中的偏差。通过使用语言模型捕捉语言偏见,并影响基础 VQA 模型的预测来动态调整损失,强制模型同时使用两种输入模态,以克服训练集分布之外的数据低效问题。在特定测试数据集上取得了当前最先进的结果。