May, 2023

WeLayout:面向 ICDAR 2023 企业文档鲁棒版面分割竞赛的微信版面分析系统

TL;DR本文介绍了 WeLayout 的设计和实现,该系统利用 DINO 和 YOLO 模型进行了 ICDAR2023 比赛上对齐的版面分割。使用数据增强、模型架构、边界框细化、模型集成以及贝叶斯优化算法等技术,我们取得了优异的表现,mAP 分数达到了 70.0,并展示了对查询驱动和无锚定模型相结合的优势,以实现企业文档中的鲁棒的版面分割。