May, 2020

全局表格抽取器(GTE):使用视觉上下文进行联合表格识别和单元格结构识别的框架

TL;DR本文介绍了全局表格提取器(GTE),它是一种由视觉引导的系统框架,旨在通过基于自然单元格包含约束的新型罚函数来训练表格网络,以检测表格和单元格结构,结合表格风格,设计一种新的分层单元格检测网络,并定期标记表格和单元格结构以便成为训练数据。实验证明,GTE 在表格检测和单元格结构识别方面超过之前的最先进结果,并且在新的跨域 FinTabNet 数据集上的实验表明,在单元格结构识别方面比 vanilla RetinaNet 的物体检测模型提高了 45% 以上。