Apr, 2023

ChartSumm: 长短汇总自动图表概括的综合基准

TL;DR本文介绍了 ChartSumm 数据集,它是一个大规模的基准数据集,由 84,363 个图表及其元数据和描述组成,涵盖了各种主题和图表类型。该数据集可用于生成短和长的摘要,用以提供给视障人士以及为其他数据驱动模型的训练提供基础。通过使用 ChartSumm 数据集进行大量实验,发现仍有调查的空间,如资料遗漏,产生幻觉,以及对图表中复杂趋势的不恰当解释。作者研究了扩展 ChartSumm 数据集以适用于其他语言的潜力,这使我们的数据集成为未来研究的有挑战性的基准。