Oct, 2023

面向复杂推理与常识理解的文档级图表问答

TL;DR在这项工作中,我们介绍了一项名为文档层次的图表问答 (DCQA) 的新任务,旨在通过文档布局分析 (DLA) 首先提取文档中的图表或绘图,然后进行图表问答 (CQA),并开发了强大的问题 - 答案生成引擎,实现了视觉文档中图表的复杂推理和常识问题的 OCR-free 理解。