Aug, 2023

论孟加拉文档布局分析数据集中的框架和模型分析:BaDLAD

TL;DR本研究通过使用先进的计算机程序 (Detectron2、YOLOv8 和 SAM) 来理解孟加拉文档布局。我们研究了许多不同的孟加拉文档。Detectron2 非常擅长找到和分离文本框和段落等文档的不同部分。YOLOv8 在识别表格和图片方面表现良好。我们还尝试了 SAM,它帮助我们理解棘手的布局。通过比较它们的准确性和速度,我们了解到它们在不同类型的文档中的适用性。我们的研究有助于理解孟加拉文档中的复杂布局,也可以对其他语言有所帮助。