BriefGPT.xyz
Mar, 2022
基于 Dessurt 的端到端文档识别与理解
End-to-end Document Recognition and Understanding with Dessurt
HTML
PDF
Brian Davis, Bryan Morse, Bryan Price, Chris Tensmeyer, Curtis Wigington...
TL;DR
Dessurt是一种相对简单的文档理解变压器,它可以对比以往方法更多种类的文档任务进行微调。该模型能够自动识别文本,无需像以前的方法那样使用外部识别模型。并且Dessurt比以前的方法更灵活,能够处理各种文档领域和任务。研究表明,在九种不同的数据集任务组合中,这种模型是有效的。
Abstract
We introduce
dessurt
, a relatively simple
document understanding
transformer
capable of being fine-tuned on a greater variety of document
→