COLINGSep, 2022

通过区分表面相似的实例来克服视觉问答中的语言先验

TL;DR本文提出了一种新的视觉问答框架,通过定义相同问题类型但回答不同的训练实例作为 “表面相似的实例”,并在此基础上构建一个区分模块,达到了超越语言先验的最先进性能。