基于 ROI 权重的学习图像压缩与比特分配
通过结合 MSE-based 模型和生成模型中感兴趣区域 (ROI) 的优势,我们提出了分层感兴趣区域 (H-ROI) 方法,将图像分为几个前景区域和一个背景区域,以提高包含人脸、文字和复杂纹理的区域的重建效果;进一步,通过通道维度内的非线性映射提出了自适应量化来限制比特率同时保持视觉质量。大量实验证明了我们方法在小脸和文字上以更低的比特率实现了更好的视觉质量,如 HiFiC 的 0.7X 比特和 BPG 的 0.5X 比特。
Mar, 2024
本文提出一种内容加权的编码器 - 解码器模型,配合重要性掩模子网,通过局部自适应的比特率分配和控制方法,有效地进行学习型有损图像压缩,同时通过修剪的卷积神经网络实现对量化编码方法的有损压缩。实验证实该方法可以比深度和传统有损图像压缩方法获得更优成果。
Apr, 2019
本文提出了一种基于 transformer 学习的图像压缩系统,通过使用 prompt generation 网络,支持 RO I 功能,并允许同时实现可变速和 ROI 编码。实验结果表明,该方法优于其他竞争方法。
May, 2023
本文提出了一种改进的图像压缩模型,通过改善人类感知和效率,实现了与最先进的端到端学习图像压缩方法和经典方法相竞争的主观效果,并且较少解码时间和提供人性化的压缩,通过经验评估,证明了我们提出的方法在实现优秀性能方面的有效性,与相同主观质量相比,节约了超过 25%的比特率。
May, 2023
本文提出了一种新颖的深度对抗学习视频压缩模型,该模型采用一个辅助的对抗性失真目标函数,我们将该目标函数与传统的质量指标如 MS-SSIM 和 PSNR 相比较,发现该对抗目标函数更符合人类感知质量判断标准,实验结果证明该模型能够在极高的压缩率下减少感知失真和重建丢失的细节。
Apr, 2020
本文研究了如何将生成敌对网络与学习压缩相结合,得到一种最先进的生成有损压缩系统,并在归一化层、生成器和鉴别器架构、训练策略以及感知损失方面进行了探究。与之前的工作不同的是,我们实现了在广泛的比特率范围内视觉上令人满意的重建,并且,我们的方法可以应用于高分辨率图像。我们在定量上使用各种感知指标和用户研究来评估我们的方法,研究表明,即使使用超过 2 倍的比特率,我们的方法也优于以前的方法。
Jun, 2020
该论文提出了一种面向视觉分析的率失真模型,基于机器学习算法的方法确定了每个编码单元的重要程度,并提出了一种新的失真度量模型以提高图像压缩的品质,从而在多个典型视觉分析任务中实现了高达 28.17% 的比特率节约。
Apr, 2021
通过辅助损失训练编码器以提升其识别能力和速率失真性能的一种新型学习图像编码方法,相较于传统训练方法,在物体检测和语义分割任务中分别实现了 27.7% 和 20.3% 的 Bjontegaard Delta 速率改进。
Feb, 2024
本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块,将二进制 ROI 掩模集成到不同层的网络中,以提供空间信息指导。实验结果表明,这种模型在 ROI PSNR 方面优于其他方法,在 COOCO 验证集上具有更好的目标检测和实例分割性能。
May, 2023