ECCVNov, 2021

图表理解的分类回归

TL;DR本文针对图表理解任务的挑战,提出了一种新型的图表问答模型。我们提出的联合分类与回归模型使用了共现注意力变换器,在处理文本语言和视觉元素的复杂互动时表现出色。在经过广泛的实验验证后,我们的模型在真实场景下的 PlotQA 数据集上表现出卓越的性能,也在 FigureQA 数据集上表现出竞争性的结果。此外,我们的模型特别适用于需要回归的非词汇库答案的实际问题。