EMNLPAug, 2021
LayoutReader:用于阅读顺序检测的文本和布局预训练
LayoutReader: Pre-training of Text and Layout for Reading Order Detection
Zilong Wang, Yiheng Xu, Lei Cui, Jingbo Shang, Furu Wei
TL;DR本论文提出了一个读取顺序检测系统,使用深度学习和基于 seq2seq 模型的 LayoutReader,对包含 500,000 份文档的 ReadingBank 数据库进行了测试,并提高了开源和商业 OCR 引擎的文本顺序识别能力。