Apr, 2024

RanLayNet:一种用于领域自适应和泛化的文档布局检测数据集

TL;DR为了解决有限多样性数据集对深度学习模型的影响问题,我们引入了一个包含空间位置、范围和布局元素类型的标签的合成文档数据集 RanLayNet。经过实验证明,使用我们的数据集训练的深度布局识别模型相比仅使用实际文档训练的模型表现更优。此外,我们通过对 Doclaynet 数据集使用 PubLayNet 和 IIIT-AR-13K 数据集的微调模型进行比较分析,发现使用我们的数据集进行增强的模型在科学文档领域的 TABLE 类任务中取得了 0.398 和 0.588 的 mAP95 分数。