Dec, 2023

UPOCR:面向统一像素级 OCR 接口

TL;DR提出了一种名为 UPOCR 的简单而有效的通用模型,用于统一的像素级光学字符识别接口,通过图像转化和基于视觉 Transformer 的编码器 - 解码器结构统一了多样的 OCR 任务的范式,并引入可学习的任务提示使解码器具有任务感知性,在三个像素级 OCR 任务上的实验结果显示,该方法可以在一个统一的模型上同时实现三个任务的最先进性能,为未来关于通用 OCR 模型的研究提供了有价值的策略和见解。