EMNLPOct, 2023

BLA 基准:研究预训练多模态模型的基本语言能力

TL;DR我们探索了预训练语言与视觉模型在基本语言构造方面的处理程度,并提出了 BLA 评估基准,发现各种类型的基于 Transformer 的系统普遍在零样本设置下难以处理 BLA,但生成型的 BLIP2 在上下文学习环境中显示出有希望的趋势,这为将 BLA 用作评估基准以及提高模型的基本语言能力打开了大门。