Mar, 2019

CLEVR-Dialog: 一个用于视觉对话多轮推理的诊断数据集

TL;DR开发了一个名为CLEVR-Dialog的大型诊断数据集,以研究视觉对话中的多轮推理(multiround reasoning),在其中所有视觉对话的所有方面都得到了完全注释。使用CLEVR-Dialog测量了标准视觉对话模型的性能,特别是针对视觉指代消解(coreference resolution)的表现,并于之前数据集中的模型进行了比较,发现了其中的差异。