COLINGMar, 2024

PEaCE:面向科学文档的光学字符识别数据集

TL;DR光学字符识别(OCR)是一项旨在识别图像中存在的文本的已建立任务。本研究旨在通过提出 PEaCE 数据集并评估基于 Transformer 的 OCR 模型的有效性,弥合 Parse PubMed 文章中的表格这个问题,并发现小块大小的模型通过使用所提出的转换在多个领域上训练能够获得最佳性能。