利用多级字典进行无损图像压缩:二值图像
使用贝叶斯框架和字典学习设计了一种代价函数,可以重建出更高质量的二进制文档图像并构建出表示和编码该图像的字典,实验结果表明该方法相对于原始噪音图像在视觉效果和压缩比上得到了显著提升。
Apr, 2017
我们提出了第一个实用的学习无损图像压缩系统 L3C,它在压缩方面优于流行的人工编码器 PNG、WebP 和 JPEG 2000。L3C 的核心是一种可完全并行化的分层自适应熵编码概率模型,该模型针对压缩任务进行了端到端的优化。与最近的自回归离散概率模型(如 PixelCNN)相比,我们的方法将图像分布与学习的辅助表示一起建模,而不是仅在 RGB 空间中建模图像分布,并且只需要三个前向传递来预测所有像素的概率,而不是为每个像素分别预测一个。此外,我们发现学习辅助表示至关重要,而且显著优于预定义的辅助表示,如 RGB 金字塔。
Nov, 2018
本文提出一种多尺度渐进统计模型,兼顾像素级别处理和多尺度处理,能够在不显著降低推理速度的情况下,在两个大型基准数据集上显著优于现有的无损图像压缩方法。
Aug, 2021
通过学习的量化表和马尔科夫分层变化自动编码器构建的统一有损和无损 JPEG 重新压缩框架,在接近上界的比特率下可以实现任意低的失真。据我们所知,这是填补 JPEG 图像损失和无损重压缩之间差距的第一个学习方法。
Dec, 2023
利用 BPG 算法实现了一种损耗压缩图像的方法,该方法使用卷积神经网络模型对残差进行无损编码,通过与之前的学习方法以及 PNG、WebP、JPEG2000 进行比较,实现最先进的无损全分辨率图像压缩效果。
Mar, 2020
本文介绍了基于深度学习的 JPEG 图像重压缩方法,能够在 DCT 域中进行操作,提出了多级交叉通道熵模型以压缩最具信息量的 Y 分量,在保证无损的前提下实现了 JPEG 图像转码为更节省存储空间的比特流,实验表明该方法在传统 JPEG 重压缩方法(Lepton,JPEG XL 和 CMIX)中表现出最先进的性能。
Mar, 2022
本文研究图像压缩对图像分类、目标检测及语义分割等三种视觉识别任务准确性的影响。研究采用传统编解码器及最新的神经压缩方法进行实验,探究压缩比从 0.1 到 2bpp 下的识别准确度。实验发现,在强压缩下,三个任务的识别准确度都会受到显著影响。通过在压缩的训练图像上对识别模型进行微调,可以从一定程度上恢复性能损失。
Apr, 2023
本研究使用 GPT-4V 和 DALL-E3 探索图像压缩的质量 - 压缩性能边界,并通过介绍迭代反射过程改善解码图像,将语义压缩推到 100 μbpp(比 JPEG 小了 10,000 倍)。进一步假设这个 100 μbpp 水平代表标准图像分辨率下语义压缩的一个软限制。
Feb, 2024
本论文提出了一种基于循环卷积神经网络的有损图像压缩方法,通过像素权重损失、改进循环神经网络的结构以及自适应位分配算法,成功取得了多项实验成果优于 BPG、WebP、JPEG2000 和 JPEG 等标准方式。
Mar, 2017