关于学习图像压缩中颜色空间效应的研究
通过基于结构和颜色的学习图像编解码器(SLIC),将压缩任务分割为亮度和色度,构建具有新颖的多尺度架构的深度学习模型,通过将不同阶段的特征结合以获取潜在表示。通过各种实验研究和分析,与其他图像编解码器进行比较,通过通道脉冲响应、潜在通道和各种消融研究的可视化,说明了该方法的优势。该模型在 MS-SSIM 和 CIEDE2000 度量标准中相对于其他先进参考编解码器获得了 7.5% 和 4.66% 的比特率增益。
Jan, 2024
本文提出了一种新的基于深度学习的图像压缩模型,该模型将图像压缩任务分解为从亮度通道学习结构信息和从色度通道学习颜色的两个子任务。利用 CIEDE2000 优化颜色保真度,并展示了该模型的优点和性能比较。此外,还对潜在通道脉冲响应进行了可视化和分析。
Jun, 2023
本研究探究了支持 YUV 4:2:0 格式的各种深度学习编码器设计,并将它们与 HEVC 和 VVC 标准的主要配置进行比较,提出了一种新的转换网络体系结构以提高编码效率,并在 YUV 4:2:0 数据集上进行了实验,结果显示提出的解决方案在性能上显著优于现有 RGB 编码器的朴素扩展,在 HEVC 的帧内编码上平均 BD 码率提高了约 10%。
Feb, 2021
我们提出了第一个实用的学习无损图像压缩系统 L3C,它在压缩方面优于流行的人工编码器 PNG、WebP 和 JPEG 2000。L3C 的核心是一种可完全并行化的分层自适应熵编码概率模型,该模型针对压缩任务进行了端到端的优化。与最近的自回归离散概率模型(如 PixelCNN)相比,我们的方法将图像分布与学习的辅助表示一起建模,而不是仅在 RGB 空间中建模图像分布,并且只需要三个前向传递来预测所有像素的概率,而不是为每个像素分别预测一个。此外,我们发现学习辅助表示至关重要,而且显著优于预定义的辅助表示,如 RGB 金字塔。
Nov, 2018
本研究通过对 RGB、HSV、HSL、XYZ、CIELAB 和 CIELUV 等多种颜色模型进行比较分析,评估它们在准确反映人类感知颜色方面的有效性,从而评价它们在准确反映视觉颜色差异和与人眼兼容的主导调色板提取方面的能力,以便应用于图像处理,数字媒体和设计等相关领域。
Jun, 2024
提出了一种基于 latent space 学习的,对 raw images 进行压缩的新框架,包括了对于图像的不对称和混合空间特征分辨率设计、context model 的新设计和 sRGB 导向的自适应量化策略设计,并且提供了一种新的单模型可实现不同比特率的策略。实验结果表明,该方法在较小的 metadata size 情况下能够获得更好的重构质量。
Jun, 2023
本文研究图像压缩对图像分类、目标检测及语义分割等三种视觉识别任务准确性的影响。研究采用传统编解码器及最新的神经压缩方法进行实验,探究压缩比从 0.1 到 2bpp 下的识别准确度。实验发现,在强压缩下,三个任务的识别准确度都会受到显著影响。通过在压缩的训练图像上对识别模型进行微调,可以从一定程度上恢复性能损失。
Apr, 2023
探讨了颜色空间对于图像分类的影响,展示了多颜色空间模型在 CIFAR-10、CIFAR-100、SVHN 和 Imagenet 等多个数据集上都能够取得高水平的分类准确度,并且参数数量很少。
Feb, 2019
提出了一种基于水平 / 垂直强度(HVI)的新型可训练颜色空间,该颜色空间解耦了 RGB 通道的亮度和色彩,有效改善了低光图像增强过程中的颜色和亮度伪影问题。同时,设计了一种名为 CIDNet 的新型颜色和亮度解耦网络,并在该网络中引入了轻量级交叉注意力(LCA)模块,以促进 HVI 空间中图像结构和内容信息之间的交互,同时抑制低光噪声。在 22 个定量和定性实验中,CIDNet 相较于其他先进方法在 11 个数据集上取得更好的效果。
Feb, 2024