EMNLPAug, 2021

LayoutReader:用于阅读顺序检测的文本和布局预训练

TL;DR本论文提出了一个读取顺序检测系统,使用深度学习和基于 seq2seq 模型的 LayoutReader,对包含 500,000 份文档的 ReadingBank 数据库进行了测试,并提高了开源和商业 OCR 引擎的文本顺序识别能力。