ACLMar, 2022

从视觉信号探索空间常识中未被书写的事物

TL;DR本研究利用图像合成的方法,构建了一个专注于对象相对尺度和位置关系的空间常识基准,并证明相较于文本预训练模型,具有视觉信号的模型更能准确和持续地学习空间常识,从中获得的知识也可用于具有空间常识的自然语言理解任务。