JPEG-AI 验证模型中的比特率匹配算法优化
当前,对基于神经网络的图像压缩编解码器有很高的需求。这些编解码器采用非线性变换创建紧凑的位表示,并通过在设备上实现快速编码速度,与经典框架中使用的手工设计变换相比,科研和工业界对这些特性非常感兴趣,推动了 JPEG-AI 的标准化工作。通过利用神经网络,该模型在基本运行点上超过传统编解码器的 10% BD 率,并通过在空间域中灵活分配位分布,与 VVC intra 的锚点生成恒定质量点的方式形成鲜明对比。然而,我们的研究发现,通过实现各种块尺寸,VVC intra 显示出更具适应性的位分布结构。由于我们的观察结果,我们提出了一种空间位分配方法来优化 JPEG-AI 的位分布并提高视觉质量。此外,通过应用 VVC 的位分布策略,可以进一步提高 JPEG-AI 的客观性能,使 PSNR-Y 获得最大增益 0.45 dB。
Feb, 2024
描述一种图像压缩方法,其由非线性分析变换、均匀量化器和非线性合成变换构成,并使用卷积线性滤波器和非线性激活函数的三个连续阶段构建变换,其中联合非线性性选择实现形式的局部增益控制,利用随机梯度下降的变体优化整个模型以实现训练图像数据库的速率失真性能,以及一个连续的代理来引入量化器产生的不连续损失函数,具有比标准 JPEG 和 JPEG2000 压缩方法更好的速率失真性能,并且在所有位率下对所有图像的视觉质量均有显著提高。
Nov, 2016
本文提出了一种新的联合学习模式的图像压缩和质量增强方案 ——JointIQ-Net,通过采用高斯混合模型进行极小化熵模型改进,并进一步利用全局上下文估计潜在表示的概率,实现了编码效率的极大提升,达到了比传统编解码器和以往学习图像压缩方法更好的压缩效果。
Dec, 2019
本文提出了 AlphaVC 的压缩算法,采用了几种新的技术来有效地提高压缩性能,包括引入条件 I 帧、像素到特征的运动预测方法和基于概率的熵跳过方法。AlphaVC 在所有常见测试数据集上的 PSNR 和 MSSSIM 指标上均超过了最新的压缩标准 VVC,并且具有非常快的编码和解码速度。
Jul, 2022
本研究提出了一种名为 NN-VVC 的混合编解码器,结合了 E2E-learned 图像编解码器和传统视频编解码器 (CVC),在图像和视频编码领域为机器实现高性能。实验证明,该系统在多个数据集和机器视觉任务上较 VVC 实现了高达 - 43.20% 和 - 26.8% 的 Bjøntegaard Delta 速率减小。据我们所知,这是第一篇在多个数据集和多个机器视觉任务上展示了优于 VVC 的混合视频编解码器的研究论文。
Jan, 2024
摘要:本文介绍了一种新颖的体系结构,该体系结构由 JPEG 文件量化矩阵参数化,可以实现单个模型在多个不同的质量设置上达到比专门针对不同质量设置训练的模型更好的性能。该模型的训练利用了深度神经网络技术,以解决在 JPEG 图像压缩算法中存在的失真纠正问题。
Apr, 2020
通过学习的量化表和马尔科夫分层变化自动编码器构建的统一有损和无损 JPEG 重新压缩框架,在接近上界的比特率下可以实现任意低的失真。据我们所知,这是填补 JPEG 图像损失和无损重压缩之间差距的第一个学习方法。
Dec, 2023
本研究探讨了数字图像处理中的压缩方法对图像失真度和分类准确率的影响,特别是在 JPEG 压缩标准的量化表设计方面进行新的优化,取得了显著的性能提升。
Aug, 2020
该研究提出使用神经网络辅助的额外 lifting 步骤来增强传统小波变换中的 lifting 步骤。这些额外的步骤减少了小波子频带中的冗余性(尤其是混淆信息),同时提高了降低分辨率后重建图像的视觉质量。通过将该方法应用于 JPEG 2000 图像编码标准中,我们的方法能够在广泛的比特率范围内实现高达 17.4% 的平均 BD 比特率节省,同时保持 JPEG 2000 的质量和分辨率可扩展特性。
Mar, 2024