Dec, 2023

用于改进历史文献图像增强的逐层令牌到令牌转换网络

TL;DR提出了一种基于 Tokens-to-token 视觉变换器的新型文档二值化编码 - 解码器架构 T2T-BinFormer,通过逐步分词技术捕捉图像的局部信息,优于现有的 CNN 和 ViT 方法,在各个基准测试中表现出更高的效果。