Oct, 2023

基于 U-Net 的结构化文档定位的数据高效训练

TL;DR结构化文档分析和识别对于现代在线入职流程至关重要,文档定位是实现可靠关键信息提取的关键步骤。本研究提出了 SDL-Net:一种新的 U-Net 类编码器 - 解码器架构,用于定位结构化文档。我们的方法可以在包含多种文档类别样本的通用数据集上预训练 SDL-Net 的编码器,并支持对新的文档类别进行快速和数据高效的解码器微调,我们在一系列专有结构化文档图像数据集上进行了大量实验证明了所提方法的有效性和广泛适用性。