Aug, 2024

知识感知推理在多模态半结构化表格中的应用

TL;DR本研究解决了现有表格问答数据集未能有效涵盖图文融合问题的缺陷,提出了新数据集MMTabQA,以评估AI模型在多模态结构化数据上的知识感知推理能力。实验表明,当前AI模型在整合和解读多重文本与图像输入方面面临显著挑战,为提升AI在分析多模态数据中的理解能力提供了重要基准。