ACLJun, 2020

CompGuessWhat?!:基于感知的语言学习的多任务评估框架

TL;DR提出了一个评估框架 GROLLA,用于属性引导的基于场景的语言学习,其中包括三个子任务,以及一个用于评估学习潜在表征质量的新数据集 CompGuessWhat?!。结果显示,现有的模型学到了表达对象属性的表征的能力不足,并且它们没有学会足够稳健的策略和表征,在涉及新的场景或物体的游戏中表现最佳的无影响的准确度为 50.06%。