Jun, 2024

TabPedia:利用概念协同的全面视觉表格理解

TL;DR该研究介绍了一种新型的大型视觉语言模型TabPedia,并采用概念协同机制,将多样的视觉表格理解任务和多源视觉嵌入抽象为概念,实现了无缝集成表格检测、表格结构识别、表格查询和表格问答等视觉表格理解任务,证实了大型语言模型在视觉表格理解中的有效性。