ICLROct, 2017

FigureQA:一份为视觉推理而注释的图像数据集

TL;DRFigureQA 是一个视觉推理语料库,包含超过一百万个基于 100,000 张图像的问题 - 答案对。图像来自五个类别的合成科学式图形:线图、点线图、垂直和水平条形图以及饼状图。通过从 15 个模板中生成问题并提供用于训练机器学习模型的附属数据,FigureQA 为开发可以直观地识别数据可视化中的模式的模型迈出了第一步。