Oct, 2022

场景文本图像超分辨率:基于内容感知损失和交叉变换块的方法

TL;DR使用 Criss-Cross Transformer Blocks 和 Content Perceptual Loss,利用多尺度文本识别特征将内容意义有效地融入框架中,设计出了 TATSR 来提高文本图像的可读性和人类感知。在各种语言数据集上的广泛实验表明,TATSR 在识别精度和人类感知方面优于现有技术。