Dec, 2023

DocBinFormer:一种用于有效文档图像二值化的两级 Transformer 网络

TL;DR提出了一种名为 DocBinFormer(文档二值化变换器)的基于视觉变换器的两级架构,用于有效地对文档图像进行二值化分析,该架构利用双级变换器编码器从输入图像中有效地捕获全局和局部特征表示,从而在系统生成和手写文档图像的分析中取得了改进的结果,并在 DIBCO 和 H-DIBCO 基准数据集上超过了现有技术的表现。