Jan, 2020
TableNet: 一种深度学习模型,用于从扫描文档图像中端到端地检测表格并提取表格数据
TableNet: Deep Learning model for end-to-end Table detection and Tabular
data extraction from Scanned Document Images
TL;DR本文介绍了TableNet——一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013和Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。