Jun, 2019

RUBi:减少视觉问答中单模态偏见

TL;DR提出了一种新的学习策略 RUBi,它减少了任何 VQA 模型中的偏差。通过使用语言模型捕捉语言偏见,并影响基础 VQA 模型的预测来动态调整损失,强制模型同时使用两种输入模态,以克服训练集分布之外的数据低效问题。在特定测试数据集上取得了当前最先进的结果。