Dec, 2016

CLEVR:一个用于组合语言和初级视觉推理的诊断数据集

TL;DR通过建立人工智能系统,以便对视觉数据进行推理和回答问题,我们需要有诊断测试来分析进展并发现缺点。该研究提出了一种诊断数据集,测试了各种视觉推理能力,包含最小的偏差并具有详细注释,描述每个问题需要的推理类型,用于分析各种现代视觉推理系统,提供了新的洞见,以及它们的能力和限制。