基于注意力机制的图像压缩后处理卷积神经网络

CVPRMay, 2019

基于注意力机制的图像压缩后处理卷积神经网络

Attention Based Image Compression Post-Processing Convolutional Neural Network

Yuyang Xue, Jiannan Su

TL;DR提出了一种基于注意力机制的卷积神经网络用于低码率图像压缩的后处理，该后处理模块采用 MAE 和 MS-SSIM 损失训练，在 0.15 比特率下平均 PSNR 最高可达 32.10。

Abstract

The traditional image compressors, e.g., BPG and H.266, have achieved great image and video compression quality. Recently, convolutional neural network has been used widely in image compression. We proposed an

image compression convolutional neural network attention-based low bit-rate post-processing

发现论文，激发创造

仅使用基于注意力的神经网络进行图像压缩

本研究探讨了只使用注意力层进行图像压缩的可行性，并在我们的新模型 QPressFormer 中引入了学习的图像查询的概念，通过交叉注意力聚合补丁信息，然后进行量化和编码技术，通过对 Kodak、DIV2K 和 CLIC 数据集进行全面评估，显示了无卷积架构在图像压缩中达到了竞争性的性能。

Oct, 2023

HEVC 基础编码中的卷积神经网络后处理方法

本文提出了一种基于卷积神经网络的后处理算法用于高效视频编码，相较于 HEVC 基线平均比特率减少了 4.6％，并在实现更高的比特率降低，更低的内存成本和更快的计算速度方面优于以前研究的网络。

Aug, 2016

通过端到端学习的深度图像压缩

使用深度卷积神经网络的有损图像压缩方法，结合感知损失和对抗损失以及逐渐引入量化误差和速率约束的易到难迁移学习实现更好的速率 - 失真优化。在多个数据集中，相比于 BPG，WebP，JPEG2000 和 JPEG，平均达到了 7.81％ - 19.1％的 BD - 率降低。

Jun, 2018

计算效率高的神经图像压缩

通过自动网络优化技术减少神经图像压缩中解码器的计算复杂度，探索码率失真性能和运行时间性能之间的平衡，提高图像压缩的计算效率。

Dec, 2019

适用于循环网络的引导和空间自适应比特速率的改进有损图像压缩

本论文提出了一种基于循环卷积神经网络的有损图像压缩方法，通过像素权重损失、改进循环神经网络的结构以及自适应位分配算法，成功取得了多项实验成果优于 BPG、WebP、JPEG2000 和 JPEG 等标准方式。

Mar, 2017

CAS-CNN：一种深度卷积神经网络用于图像压缩伪影抑制

本研究提出了一种新型的 12 层深度卷积神经网络，用于图像压缩伪影抑制，其具有分层跳过连接和多尺度损失函数。相较于普通的 JPEG，可提高高达 1.79 dB 的峰值信噪比，并且相较于先前最佳 ConvNet 结果提高高达 0.36 dB。该研究表明，训练用于特定质量因子 (QF) 的网络对于压缩输入图像所使用的 QF 是有韧性的，单个针对 QF 60 训练的网络在多种 QF 范围内 (40 至 76) 提供超过 1.5 dB 的 PSNR 增益。

Nov, 2016

基于深度卷积神经网络学习虚拟编解码器用于图像压缩

本研究提出一种基于卷积神经网络的端到端图像压缩框架，通过特征描述神经网络获取低维有效描述，借助标准图像编解码器进一步压缩图像后，再通过后处理神经网络消除失真和压缩留痕，最终通过虚拟编解码器神经网络通过反向传播优化整个系统。实验结果表明该方法在极低比特率下比当前现有算法性能更优。

Dec, 2017

通过深度学习和传统编解码器优化混合分层图像压缩

本文提出一个基于深度学习和传统图像编解码器相结合的图像压缩框架并在 Kodak 和 Tecnick 数据集上进行实验，结果表明改进的分层压缩方案比现有方案和传统编解码器都表现更好，在 RGB444 中编码图像，无论在 PSNR 和 MS-SSIM 度量方面在广泛比特率范围内都有优异的表现。

Jul, 2019

使用离散化高斯混合似然和注意力模块的图片学习压缩

本文提出了一种采用离散化高斯混合似然函数来参数化潜在代码分布的方法，并结合最近的注意力模块将其纳入网络架构中以增强性能。实验结果表明，我们提出的方法在 Kodak 和高分辨率数据集上都实现了最先进的性能，在 PSNR 方面与最新压缩标准 Versatile Video Coding（VVC）实现了可比较的性能，并且在经过 MS-SSIM 优化后，我们的方法生成了更加视觉上愉悦的结果。

Jan, 2020

使用深度卷积网络的语义感知图像压缩

应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题，通过训练一个特定的卷积神经网络，实现对图像语义的理解，并通过对每个对象训练特征的方式生成高质量的压缩图像。

Dec, 2016