Feb, 2023

CTE:一种用于上下文化表格提取的数据集

TL;DR该论文提出了一种 Contextualized Table Extraction (CTE) 的任务,目的是根据文档的文本信息来提取和定义表格结构,提供了一个包含超过 35,000 个表格的科学论文的数据集,并且可以用于开发各种任务的端到端流程,包括文档布局分析、表格检测、结构识别和功能分析,并且定义了评估指标,描述了此数据集的优点、限制和未来工作。