May, 2023

重新审视用于具有视觉丰富度文档的表格检测数据集

TL;DR本文提出了一种新的数据集 Open-Tables 和 ICT-TD,利用领域专家指导手动注释,清理了现有数据集中的噪声,并将注释定义进行了统一,结果表明这些新数据集更适合交叉领域设置,可提供高质量和一致性注释,更可靠地进行模型评估。