一种用于有损图像压缩的速率失真分类方法
通过我们的速率 - 失真计算(RDC)研究,我们展示了虽然浮点运算(FLOPs)和运行时间对于准确地比较神经压缩方法都是不足够的,但我们还是找到了一种新型神经压缩架构,其在计算要求和 RD 性能之间具有最佳的实证权衡。
Sep, 2023
本文通过量化解码复杂度作为优化目标,系统研究了神经图像编解码器的速率 - 失真 - 复杂度(RDC)优化,并设计了一个可变复杂度的神经编解码器,支持精细的复杂度调整,展示了 RDC 优化在神经图像编解码器中的可行性和灵活性。
May, 2023
该论文提出了一种面向视觉分析的率失真模型,基于机器学习算法的方法确定了每个编码单元的重要程度,并提出了一种新的失真度量模型以提高图像压缩的品质,从而在多个典型视觉分析任务中实现了高达 28.17% 的比特率节约。
Apr, 2021
通过采用 Blau & Michaeli 2018 年提出的感知质量的数学定义,研究了速率、失真和感知之间的三重权衡,我们证明了该三重权衡的几个基本属性,并在一个玩具 MNIST 例子上进行了可视化说明。
Jan, 2019
本研究探讨了数字图像处理中的压缩方法对图像失真度和分类准确率的影响,特别是在 JPEG 压缩标准的量化表设计方面进行新的优化,取得了显著的性能提升。
Aug, 2020
描述一种图像压缩方法,其由非线性分析变换、均匀量化器和非线性合成变换构成,并使用卷积线性滤波器和非线性激活函数的三个连续阶段构建变换,其中联合非线性性选择实现形式的局部增益控制,利用随机梯度下降的变体优化整个模型以实现训练图像数据库的速率失真性能,以及一个连续的代理来引入量化器产生的不连续损失函数,具有比标准 JPEG 和 JPEG2000 压缩方法更好的速率失真性能,并且在所有位率下对所有图像的视觉质量均有显著提高。
Nov, 2016
本文提出了一种改进型的 GAN 图像压缩方法,通过使用 DISTS 和 MS-SSIM 指标对颜色、纹理和结构的感知退化度量以及吸收离散化的高斯 - 拉普拉斯 - 逻辑混合模型(GLLMM)来改善熵模型的准确性,并采用 MOS 实验直接评估重构图像的感知质量,实验结果表明该方法优于现有的 GAN 方法和 VVC 等最先进的混合编解码器。
Jun, 2023
基于 Wasserstein 梯度下降算法的新型 R-D 估计器,能够比现有神经网络方法更有效地在低速率源上获得可比或更严格的界限,同时需要较少的调整和计算工作。
Oct, 2023
通过我们提出的参数化失真率(R-D)转码模型,我们可以在不需要对视频进行编码的情况下准确预测不同速率的转码失真,并通过转尺寸实现视觉质量的改进。此外,我们还利用该模型确定了摄入视频的近似无损和接近零斜率的比特率范围,从而在引入几乎不可见的质量损失的同时调整转码目标比特率。实验结果证明了我们的模型在视频转码率失真预测方面的有效性。
Apr, 2024
通过使用条件扩散模型,本文展示了它作为解码器时在生成式压缩任务中的良好结果,同时通过采样方法,它们还允许在解码器端基于压缩表示创建新的失真和感知之间的权衡点。
Mar, 2024