May, 2023

SelfDocSeg:面向文档分割的自监督基于视觉的方法

TL;DR使用自我监督技术,将文档图像中的伪造布局用于预先训练图像编码器,以在无监督的框架内学习文档对象的表示和定位,然后使用目标检测模型进行微调,该流水线在文档布局分析中表现卓越。