场景文本图像超分辨率：基于内容感知损失和交叉变换块的方法

Oct, 2022

场景文本图像超分辨率：基于内容感知损失和交叉变换块的方法

Scene Text Image Super-Resolution via Content Perceptual Loss and Criss-Cross Transformer Blocks

Rui Qin, Bin Wang, Yu-Wing Tai

TL;DR使用 Criss-Cross Transformer Blocks 和 Content Perceptual Loss，利用多尺度文本识别特征将内容意义有效地融入框架中，设计出了 TATSR 来提高文本图像的可读性和人类感知。在各种语言数据集上的广泛实验表明，TATSR 在识别精度和人类感知方面优于现有技术。

Abstract

text image super-resolution is a unique and important task to enhance readability of text images to humans. It is widely used as pre-processing in scene text recognition. However, due to the complex degradation in natural scenes, recovering high-resolution texts from the low-resolution

text image super-resolution criss-cross transformer blocks content perceptual loss multi-scale text recognition human perception

发现论文，激发创造

基于识别引导的内容感知文本超分辨率

本文提出了一种基于内容感知的文本超分辨率网络，通过使用文本感知损失来指导超分辨率网络的训练，从而更加关注文本内容，有效提高了文本识别的性能。

Sep, 2019

野外场景文本图像超分辨率

本文提出一种用于自然场景摄影下的低分辨率文本识别的新方法，该方法利用超分辨率技术对图像进行预处理，并开发了一种真实场景文本超分辨率数据集（TextZoom）。我们引入了三个新型模块，包括序列残差块、边界感知损失和中央对齐模块。通过对 TextZoom 数据集的广泛实验，我们证明了我们的 TSRN 模型具有显著提升低分辨率文本识别准确性的能力。

May, 2020

学习纹理转换网络用于图像超分辨率

本文提出了一种基于注意机制的纹理转换神经网络（TTSR），采用 DNN 可学习的纹理提取器、相关嵌入模块、用于纹理传输的硬注意力模块，并且结合 LR 和 Ref 图像进行联合特征学习，从而实现图像的纹理恢复。经过广泛实验，TTSR 在定量和定性评估上都取得了显著改进。

Jun, 2020

基于文本先验引导的场景文本图像超分辨率

本文介绍了一种多阶段文字先验指导的超分辨率 (STISR) 分类模型，在基准 TextZoom 数据集上表现出明显的改进，通过将字符概率序列作为文本先验嵌入到 STISR 模型训练中，以提高低分辨率场景文本图像的分辨率和视觉质量，从而有效提高现有 STISR 方法的文本识别精度。

Jun, 2021

提升光学字符识别：超分辨率方法

本文总结了我们参加 ICDAR2015 文本图像超分辨率比赛的入门知识。根据 ICDAR2015 TextSR 数据集和 Tesseract-OCR 3.02 系统，我们的文本图像超分辨率框架取得了胜利，使用低分辨率图像作为输入，OCR 准确性得分为 77.19％，与使用原始高分辨率图像的 78.80％相当。

Jun, 2015

基于文本条件扩散模型的场景文本图像超分辨率

本研究使用文本条件扩散模型（DMs）实现场景文本图像超分辨率（STISR）任务，并提出了一个针对合成低分辨率 - 高分辨率配对文本图像数据集的新框架，该框架包含三个专门的 DMs 模块，分别用于文本图像合成、超分辨率和图像退化。实验证明，使用这些合成图像对可显著提高 STISR 方法在 TextZoom 评估中的性能。

Nov, 2023

C3-STISR: 三重线索场景文本图像超分辨率

该论文提出了一种结合识别器反馈、视觉和语言信息的方法 C3-STISR 来引导超分辨率，通过有效的提取和融合机制，生成了全面和统一的引导，在 TextZoom 上的实验表明，C3-STISR 在保真度和识别性能方面优于最先进的方法。

Apr, 2022

面向空间变形鲁棒的文本关注网络用于场景文本图像超分辨率

本论文介绍了基于 CNN 的文本超分辨率方法，其中包括文本识别、文本先验信息提取和全局注意机制等技术，并通过在 TextZoom 数据集上的实验验证了该方法的良好性能和准确性。

Mar, 2022

CasSR: 激活图像力量的真实世界图像超分辨率

通过级联扩散控制模型和多重注意机制，本研究提出了一种图像超分辨率方法，其目标是从降质版本中生成高质量、清晰的图像。研究结果表明该方法在提高图像还原的准确性和真实性方面非常有效和优越。

Mar, 2024

Text Gestalt: 基于笔画的场景文本图像超分辨率

本文提出了一种 Stroke-Aware Scene Text Image Super-Resolution 方法，通过设计规则分解英文字符和数字，设计 Stroke-Focused Module（SFM）以集中于字符的笔画级内部结构，旨在通过预训练文本识别器为位置提供笔画级别的注意力图，并控制所生成的超分辨率图像与高分辨率真实值之间的一致性，从而实现低分辨率场景文本图像识别的目的。

Dec, 2021