Swin Transformers 中的 N-Gram 用于高效轻量级图像超分辨率

CVPRNov, 2022

Swin Transformers 中的 N-Gram 用于高效轻量级图像超分辨率

N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution

Haram Choi, Jeongmin Lee, Jihoon Yang

TL;DR通过将 N-Gram 上下文引入到图像超分辨率中，提出了 NGswin 和 SwimIR-NG，并通过实验证明了其比之前的方法更加高效且性能更好。

Abstract

While some studies have proven that swin transformer (Swin) with window self-attention (WSA) is suitable for single image super-resolution (SR), the plain WSA ignores the broad regions when reconstructing high-re

swin transformer image super-resolution n-gram context scdp bottleneck efficient structure

发现论文，激发创造

基于增强的 Swin Transformer 及本地 - 全局特征的交替聚合的图像超分辨重建网络

本论文通过交替聚合局部全局特征，引入了位移卷积实现局部空间信息和通道信息的交互，并提出了块稀疏全局感知模块以进一步实现空间和通道信息的交互。同时，引入了多尺度自注意模块和低参数残差通道注意模块，实现了不同尺度上的信息聚合。在五个公开数据集上验证了提出的网络，在超分辨率方面超过了其他最先进的网络。

Dec, 2023

Swin Transformer: 使用偏移窗口的分层视觉 Transformer

本文提出了一种新的视觉 Transformer，称为 Swin Transformer，它在计算机视觉领域中作为通用骨干具有很强的能力，包括图像分类和目标检测。Swim Transformer 的层次设计和移位窗口方法对于所有多层感知器架构也证明是有益的，并且模型和代码是公开的。

Mar, 2021

Swin2SR：用于压缩图像超分辨率与恢复的 SwinV2 Transformer

本文采用 Swin Transformer V2 来改善图像超分辨率问题，特别是针对压缩输入情况，通过实验验证 Swin2SR 方法能显著提高 SwinIR 的性能。

Sep, 2022

SwinIR：使用 Swin Transformer 进行图像恢复

本研究提出了一种基于 Swin Transformer 的强基线模型 SwinIR，用于图像恢复，通过对三种典型任务进行实验（图像超分辨率、图像降噪和 JPEG 压缩），实验结果表明，SwinIR 在不同任务上的表现比最先进的方法提高了至多 0.14~0.45dB，同时可以将参数总数减少高达 67%。

Aug, 2021

SwinFIR：通过快速傅里叶卷积和改进的训练重新审视 SwinIR 并用于图像超分辨率

本文介绍了一种基于 Transformer 的方法，用于图像恢复，提出了一种名为 SwinFIR 的扩展方法，旨在提高捕捉全局信息的效率，同时改进了数据增强、预训练、特征集成等高级技术，使模型的性能得到显着提高，并在多个大型基准测试上取得了最先进的性能。

Aug, 2022

StyleSwin：基于 Transformer 的 GAN 用于高分辨率图像生成

本文研究探索类似于 pure transformers 的 GAN 架构来进行高分辨率图像合成，并提出了基于 Swin transformer 和本地化的 Local Attention 的 StyleSwin 生成器。在高分辨率合成过程中，采用双重注意力机制来改善生成质量、有效地抑制块状伪影，并证明了 transformers 在高分辨率图像生成方面的可用性。

Dec, 2021

Swin Transformer V2：扩大容量和分辨率

本文旨在探索大规模计算机视觉模型，并提出了三项技术来解决训练过程中的不稳定性、预训练和微调之间的分辨率差异以及对标记数据的需求量问题，成功训练了一个规模为 30 亿参数的 Swin Transformer V2 模型，在多项计算机视觉任务上取得了最佳性能表现，且训练效率远高于谷歌的类似模型。

Nov, 2021

通过小波损失训练变压器模型提高单幅图像超分辨率的定量和视觉效果

这篇论文通过引入卷积非局部稀疏注意力块（NLSA）来扩展混合变压器架构，以进一步增强其感受野，并使用小波损失来训练变压器模型以改善定量和主观性能。实验结果表明，提出的模型在各种基准数据集上提供了最先进的峰值信噪比结果以及更好的视觉表现。

Apr, 2024

超越局部窗口的限制：自适应令牌字典的先进超分辨率变换器

通过引入自适应记号字典到 SR Transformer 并建立 ATD-SR 方法来解决单图像超分辨率问题，进一步通过基于类别划分的自注意机制提升输入特征，实验证明该方法在多个单图像超分辨率基准测试中达到最佳性能。

Jan, 2024

N-Grammer: 使用潜在 n-gram 扩充 Transformer

本研究提出了一种新的改进 Transformer 模型的方法，使用了文本序列中的离散潜在表示构造 n-gram，并应用于语言建模和文本分类中，经实验证明性能优于传统的 Transformer 模型和 Primer，该模型已在 Jax 中开源以便复现。

Jul, 2022