Oct, 2023

DSG:一种端到端的文档结构生成器

TL;DR在这项研究中,我们介绍了一种名为 DSG 的文档解析系统,它是一种全面可训练的端到端系统,用于将渲染文档映射到结构化的分层格式。我们通过训练 DSG 系统,使其在实际应用中具有高效和灵活的功能,并在评估中证明 DSG 优于商业 OCR 工具并且达到了最先进的性能水平。据我们所知,我们的 DSG 系统是第一个进行层次化文档解析的全面可训练系统。