- 利用格码变换在神经压缩中接近速率失真限制
深度学习压缩方法中,通过在潜变量空间中使用晶格量化而非标量量化能够实现对向量量化的最优恢复,提高了一次性编码性能和块编码效果。
- 冷酷时尚的视频:以 800 个参数进行学习式视频编码
我们提出了一种轻量级的学习视频编解码器,每个解码像素只需要 900 个乘法和 800 个总参数。它结合了过拟合的图像编解码器 Cool-chic,并通过一个间接编码模块来利用视频的时间冗余。该模型能够以低延迟和随机访问配置压缩视频,达到接近 - 用 Wasserstein 梯度下降估计率失真函数
基于 Wasserstein 梯度下降算法的新型 R-D 估计器,能够比现有神经网络方法更有效地在低速率源上获得可比或更严格的界限,同时需要较少的调整和计算工作。
- 学习压缩图像时去噪的重要性
本文提出在训练编解码器时明确地学习图像去噪任务,通过监督编解码器的噪声 - 干净图像对,得出训练多种噪声水平图像组成的混合模型效果最佳,能在压缩、去噪任务中优于一组去噪 - 压缩模型。
- ICLR论速率失真函数和最优传输之间的关系
本文探讨了失真率和最优输运理论之间的关系,发现通过极端熵输运距离定义的函数等价于失真率函数,并使用各自的最优传输求解器将标量量化和失真率函数的求解统一起来。
- 多尺度可形变对齐和内容自适应推断用于灵活速率双向视频压缩
本文提出了一种自适应运动补偿模型,通过多尺度形变对齐方案与多尺度条件编码结合,在运动内容自适应推理的基础上利用增益单元控制位分配,达到了学习视频编码的超越前沿水平的性能。
- 浅层解码器的非对称神经图像压缩
本文采用浅层甚至线性解码变换的方法来缩短神经图像压缩的解码复杂度,并通过加强编码器网络和迭代编码来提高压缩性能与解码复杂度之间的平衡,从而实现与传统 ME-Scale 超先验结构相当的失真压缩性能,同时将总解码复杂度降低 80%。
- MM混合时空熵建模用于神经网络视频压缩
本文提出了一种强大的熵模型,能够高效地捕捉视频中的空间和时间依赖关系,使用潜在先验来减少时间冗余,使用双重空间先验来并行地减少空间冗余。此外,该熵模型还具有内容自适应量化机制,有助于编解码器实现平滑的速率调整,并通过动态位分配改善最终的速率 - 具有运动精炼和逐帧比特分配的灵活学习分层双向视频压缩
本文介绍了改进和创新改进的内容,提出了一种优化的分层双向视频压缩技术,结合运动估计和预测模块,压缩出改进的残差运动矢量,同时应用了图像压缩中提出的增益单元进行灵活速率视频压缩,该压缩技术具备真正的灵活性并且能够以多个速率 - 失真操作点进行 - CVPRDPICT:使用三层平面的深度渐进式图像压缩
本文介绍了一种基于深度学习的图像压缩算法 DPICT, 支持精细的渐进式扩展和率失真优先级信息传输,证实了其在传输方面的出色表现。
- ECCV通过分辨率自适应流编码提高深度视频压缩
本文提出了一种名为 “分辨率自适应流编码”(RaFC)的新框架,它能够有效地压缩全局和局部的流向地图,使用多分辨率表示而不是单一分辨率表示来处理复杂或简单的运动模式,并应用了速率失真准则以选择最佳的运动编码模式。大量的实验证明了该框架的有效 - 针对多种动作的汤普森取样的信息论分析
本论文提供了一种新的、基于编码的方法,用于证明 Russo 和 Van RoyBayesian 遗憾界制度对先验不确定性的依赖性,其通过熵以及由于动作数量的不断增加,熵可以变得无限大。通过引入率失真的概念,建立了新的界,从而通过信息理论的方 - 带有尺度超先验的变分图像压缩
本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法,其中使用了超先验来有效地捕获潜在表示中的空间依赖关系,证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能,并提供了不同失真度指标的不同 - 用于有损图像压缩的高效非线性转换
该研究评估了 Sadam 和 GDN 两种技术在非线性转换编码中的性能表现,结果表明这两种技术可以稳定训练过程并提高逼近未知速率失真最优转换函数的能力,同时作者详细介绍了它们的实现方法并提供开源代码。
- ICLR端到端优化的图像压缩
描述一种图像压缩方法,其由非线性分析变换、均匀量化器和非线性合成变换构成,并使用卷积线性滤波器和非线性激活函数的三个连续阶段构建变换,其中联合非线性性选择实现形式的局部增益控制,利用随机梯度下降的变体优化整个模型以实现训练图像数据库的速率失