Sep, 2024

通用OCR理论:通过统一的端到端模型迈向OCR-2.0

TL;DR本研究针对传统OCR系统在智能处理光学字符方面的不足,提出了通用OCR理论及其模型GOT,旨在推动OCR-2.0的发展。GOT是一种包含580M参数的统一端到端模型,能够处理各种光学字符任务,并提供互动OCR功能和动态分辨率支持,实验结果证明其优越性。