Aug, 2023

Detectron2 上的孟加拉文档布局分析

TL;DR我们通过使用 Detectron2 库中的先进 Mask R-CNN 模型改进了 Bengali 文档的 DLA 模型的准确性,评估了三种变体,结果表明这些模型在准确分割 Bengali 文档方面非常有效,同时我们强调了预训练权重的重要性,拓展了 Mask R-CNN 在文档布局分析、高效文档管理和 OCR 研究中的适用性,并提出了未来微调和数据增强的发展方向。