Dec, 2023
用于改进历史文献图像增强的逐层令牌到令牌转换网络
A Layer-Wise Tokens-to-Token Transformer Network for Improved Historical Document Image Enhancement
Risab Biswas, Swalpa Kumar Roy, Umapada Pal
TL;DR提出了一种基于 Tokens-to-token 视觉变换器的新型文档二值化编码 - 解码器架构 T2T-BinFormer,通过逐步分词技术捕捉图像的局部信息,优于现有的 CNN 和 ViT 方法,在各个基准测试中表现出更高的效果。