Mar, 2024

图表智能分析:优化图表概述的上下文思维方法

TL;DR数据可视化是呈现数据和挖掘其有价值洞见的关键手段。通过自然语言处理技术,图表总结任务促进了对图表的深入数据分析。本研究构建了一个大规模的全面图表 - 标题数据集,提供了每个图表的微调指导,以解决现有方法在视觉 - 语言匹配和推理能力方面存在的明显不足。基于这个数据集的广泛覆盖范围,可以实现更好的训练数据视角匹配度。此外,我们提出了一种创新的图表总结方法 ChartThinker,它基于思维链和上下文检索策略合成了深层分析,旨在提高生成摘要的逻辑连贯性和准确性。在精心策划的数据集基础上,我们训练的模型在图表总结任务中始终表现出优越性能,在 7 个评估指标上超过了 8 种最先进的模型。我们的数据集和代码可公开访问。