Jun, 2023

DocFormerv2: 文档理解的本地特征

TL;DR提出了一种多模态Transformer模型- DocFormerv2,应用于视觉文档理解领域,在多个数据集上都取得了最先进的结果,并通过大量消融实验证明了其预训练和无监督任务设计的有效性。