基于自编码器的图像压缩:学习是否能独立于量化?
该论文提出了一种基于条件自编码器的新型可变速率学习图像压缩框架,在一个网络中进行可变速率图像压缩,并提供拉格朗日乘子和量化 bin 大小两个速率控制参数,实验结果表明该模型提供了更好的率失真权衡。
Sep, 2019
通过在预训练的单速率压缩模型上进行后训练,本研究提出了三种改进方法,包括多目标优化、引入量化 - 重建偏移和使用变速率量化。在三个著名的图像压缩模型上实施这些算法后,实现了可变速率压缩,且与训练多个模型相比,压缩性能几乎没有或只有微小的损失。
Feb, 2024
描述一种图像压缩方法,其由非线性分析变换、均匀量化器和非线性合成变换构成,并使用卷积线性滤波器和非线性激活函数的三个连续阶段构建变换,其中联合非线性性选择实现形式的局部增益控制,利用随机梯度下降的变体优化整个模型以实现训练图像数据库的速率失真性能,以及一个连续的代理来引入量化器产生的不连续损失函数,具有比标准 JPEG 和 JPEG2000 压缩方法更好的速率失真性能,并且在所有位率下对所有图像的视觉质量均有显著提高。
Nov, 2016
本文提出了一种基于深度生成模型的视频压缩方法,采用三维自编码器和自回归先验以最小化速率失真损失,实现编码效果优于现有的基于运动补偿或插值的视频压缩网络,并且在设计选择和压缩技术方面进行了系统评估和扩展,包括语义压缩、自适应压缩和多模态压缩,以便在非标准成像传感器捕获的多个模态数据上实现联合压缩。
Aug, 2019
提出了一种软硬编码的方法用于神经图像压缩,通过先学习一个表达力强的隐变量空间,再采用硬编码方法解决了训练集和测试集不匹配的问题,同时引入加性噪声自适应控制量化粒度,实验结果表明该方法在复杂压缩模型上表现稳定且有效。
Apr, 2021
本研究提出了一种基于 3D-CNN 的条件概率模型方法,用于直接建模图像自动编码器隐层表示的熵,从而控制重构误差和信息熵之间的平衡关系,该方法在 MS-SSIM 能力测试中表现优异,成为一种最新的图像压缩系统。
Jan, 2018
这篇论文介绍了一种基于 Transformer 的图像压缩系统,根据用户的偏好提供可变的图像质量目标,通过引入提示符令牌,使得自适应生成,学习和适应编码和 / 或解码过程的方法,在可变的质量目标下提高了压缩效果。
Sep, 2023
本文介绍一种基于自动编码器和潜变量表示的神经压缩方法,并探讨了在训练后适应单个视频、发送模型更新以及重新调整参数等方面的改进措施。结果表明,相较于仅调整编码器的方式,对整个模型进行调整可以提高图像在视频中的压缩性能约 1 dB。
Jan, 2021