Mar, 2019

TableBank: 一份用于表格检测和识别的基准数据集

TL;DRTableBank 使用 Word 和 Latex 文档的弱监督,构建了一个新的基于图像的表格检测和识别数据集。该数据集包含 417K 个高质量标记的表格,并利用深度神经网络构建了多个强基线模型,旨在为表格检测和识别任务提供更多的深度学习方法。