本文提出了一种端到端可训练的图像压缩框架,采用自回归和分层先验的组合估计每个潜在表示的分布,并使用一种方法将比特率分配到每个图像以最大化 MS-SSIM。
Oct, 2019
通过 attention 机制,我们提出了一种新的信息变换学习熵模型,能更好地处理图像压缩的全局和局部依赖关系,实验证明该模型取得了优于现有技术的率失真性能,并且没有二次计算复杂度问题。
Dec, 2021
本研究介绍了两种增强技术:通道调节和潜在残差预测,提出了比现有上下文自适应模型更好的网络架构,该模型在最小化串行处理、保持数据完整性等方面都性能更优,在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下,本研究的模型可使速率提高 18%,比像 BPG 这样的手工工程编解码器提高 25%。
Jul, 2020
本文提出了一种基于深度生成模型的视频压缩方法,采用三维自编码器和自回归先验以最小化速率失真损失,实现编码效果优于现有的基于运动补偿或插值的视频压缩网络,并且在设计选择和压缩技术方面进行了系统评估和扩展,包括语义压缩、自适应压缩和多模态压缩,以便在非标准成像传感器捕获的多个模态数据上实现联合压缩。
Aug, 2019
提出使用离散表示图像的方法,可以让基于自回归的生成模型输出具备更好的大规模连贯性,在 ImageNet 数据集上进行实验,证明了分层条件自回归模型可以在 128×128 和 256×256 的分辨率上生成逼真的图像。
Mar, 2019
本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法,其中使用了超先验来有效地捕获潜在表示中的空间依赖关系,证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能,并提供了不同失真度指标的不同训练模型之间的定性比较。
Feb, 2018
该研究提出了一种改进的变压器 (Transformers) 自回归先验模型及 ConvNeXt-based 预 / 后处理器,并将其应用于图像压缩,提高了压缩效率和解码复杂度的权衡。
Jul, 2023
本研究提出了一种基于 3D-CNN 的条件概率模型方法,用于直接建模图像自动编码器隐层表示的熵,从而控制重构误差和信息熵之间的平衡关系,该方法在 MS-SSIM 能力测试中表现优异,成为一种最新的图像压缩系统。
Jan, 2018
本文提出了一种基于序列解码过程的因果上下文熵预测的概念,以捕捉图像压缩的全局相关性和跨通道关系,同时,采用新的独立注意力模块构建更强的转换网络,实验结果表明,该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器,达到了最先进的码率失真性能。
Nov, 2020
本文通过将自回归生成模型与有损视频压缩任务联系起来,提出了一种基于机器学习的视频压缩方法。大规模视频数据的全面评估表明,在视频数据的压缩比率及失真质量上,该方法优于传统的基于机器学习和基于传统技术的方法。
Oct, 2020