EMNLPOct, 2021

章鱼的世界:报道偏见如何影响语言模型对颜色的感知

TL;DR本文研究了文本预训练的固有局限性,提出了报告偏差作为该限制的原因之一,并分析了多模态训练在解决该问题方面的效果。研究使用了 Color Dataset 并比较了文本中的颜色分布,语言模型捕获的分布以及人类感知中的颜色分布,结果表明文本中的 reporting bias 负面影响并固有限制了单一模态训练,而多模态模型可以减轻此类影响。