基于 ROI 权重的学习图像压缩与比特分配

Jan, 2024

基于 ROI 权重的学习图像压缩与比特分配

Learned Image Compression with ROI-Weighted Distortion and Bit Allocation

Wei Jiang, Yongqi Zhai, Hangyu Li, Ronggang Wang

TL;DR我们提出了一种用于图像压缩的方法，通过使用对抗性损失生成逼真的纹理，利用感兴趣区域（ROI）掩码来指导不同区域的位分配，以达到更好的感知质量。

Abstract

This one page paper describes our method for the track of image compression. To achieve better perceptual quality, we use the adversarial loss

image compression adversarial loss perceptual quality roi mask bit allocation

发现论文，激发创造

通过分层感兴趣区域和自适应量化实现超高保真图像压缩

通过结合 MSE-based 模型和生成模型中感兴趣区域 (ROI) 的优势，我们提出了分层感兴趣区域 (H-ROI) 方法，将图像分为几个前景区域和一个背景区域，以提高包含人脸、文字和复杂纹理的区域的重建效果；进一步，通过通道维度内的非线性映射提出了自适应量化来限制比特率同时保持视觉质量。大量实验证明了我们方法在小脸和文字上以更低的比特率实现了更好的视觉质量，如 HiFiC 的 0.7X 比特和 BPG 的 0.5X 比特。

Mar, 2024

学习内容加权深度图像压缩

本文提出一种内容加权的编码器 - 解码器模型，配合重要性掩模子网，通过局部自适应的比特率分配和控制方法，有效地进行学习型有损图像压缩，同时通过修剪的卷积神经网络实现对量化编码方法的有损压缩。实验证实该方法可以比深度和传统有损图像压缩方法获得更优成果。

Apr, 2019

基于 Transformer 的变率图像压缩与感兴趣区域控制

本文提出了一种基于 transformer 学习的图像压缩系统，通过使用 prompt generation 网络，支持 RO I 功能，并允许同时实现可变速和 ROI 编码。实验结果表明，该方法优于其他竞争方法。

May, 2023

HFLIC：基于感知学习的人性化图像压缩与强化变换

本文提出了一种改进的图像压缩模型，通过改善人类感知和效率，实现了与最先进的端到端学习图像压缩方法和经典方法相竞争的主观效果，并且较少解码时间和提供人性化的压缩，通过经验评估，证明了我们提出的方法在实现优秀性能方面的有效性，与相同主观质量相比，节约了超过 25％的比特率。

May, 2023

学习视频压缩的对抗畸变

本文提出了一种新颖的深度对抗学习视频压缩模型，该模型采用一个辅助的对抗性失真目标函数，我们将该目标函数与传统的质量指标如 MS-SSIM 和 PSNR 相比较，发现该对抗目标函数更符合人类感知质量判断标准，实验结果证明该模型能够在极高的压缩率下减少感知失真和重建丢失的细节。

Apr, 2020

端到端有损图像压缩学习：一个基准

该论文对学习图像压缩方法进行了全面的文献综述，并提出了一种基于粗到细超先验模型的熵估计和信号重建方法，以提高图像压缩的效率和性能。

Feb, 2020

高保真生成图像压缩

本文研究了如何将生成敌对网络与学习压缩相结合，得到一种最先进的生成有损压缩系统，并在归一化层、生成器和鉴别器架构、训练策略以及感知损失方面进行了探究。与之前的工作不同的是，我们实现了在广泛的比特率范围内视觉上令人满意的重建，并且，我们的方法可以应用于高分辨率图像。我们在定量上使用各种感知指标和用户研究来评估我们的方法，研究表明，即使使用超过 2 倍的比特率，我们的方法也优于以前的方法。

Jun, 2020

基于视觉分析的图像编码速率失真模型

该论文提出了一种面向视觉分析的率失真模型，基于机器学习算法的方法确定了每个编码单元的重要程度，并提出了一种新的失真度量模型以提高图像压缩的品质，从而在多个典型视觉分析任务中实现了高达 28.17% 的比特率节约。

Apr, 2021

通过辅助损失优化编码器提高机器图像编码

通过辅助损失训练编码器以提升其识别能力和速率失真性能的一种新型学习图像编码方法，相较于传统训练方法，在物体检测和语义分割任务中分别实现了 27.7% 和 20.3% 的 Bjontegaard Delta 速率改进。

Feb, 2024

基于 ROI 的 Swin Transformers 深度图像压缩

本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块，将二进制 ROI 掩模集成到不同层的网络中，以提供空间信息指导。实验结果表明，这种模型在 ROI PSNR 方面优于其他方法，在 COOCO 验证集上具有更好的目标检测和实例分割性能。

May, 2023