基于注意力机制的图像压缩后处理卷积神经网络
本研究探讨了只使用注意力层进行图像压缩的可行性,并在我们的新模型 QPressFormer 中引入了学习的图像查询的概念,通过交叉注意力聚合补丁信息,然后进行量化和编码技术,通过对 Kodak、DIV2K 和 CLIC 数据集进行全面评估,显示了无卷积架构在图像压缩中达到了竞争性的性能。
Oct, 2023
本文提出了一种基于卷积神经网络的后处理算法用于高效视频编码,相较于 HEVC 基线平均比特率减少了 4.6%,并在实现更高的比特率降低,更低的内存成本和更快的计算速度方面优于以前研究的网络。
Aug, 2016
使用深度卷积神经网络的有损图像压缩方法,结合感知损失和对抗损失以及逐渐引入量化误差和速率约束的易到难迁移学习实现更好的速率 - 失真优化。在多个数据集中,相比于 BPG,WebP,JPEG2000 和 JPEG,平均达到了 7.81% - 19.1%的 BD - 率降低。
Jun, 2018
本论文提出了一种基于循环卷积神经网络的有损图像压缩方法,通过像素权重损失、改进循环神经网络的结构以及自适应位分配算法,成功取得了多项实验成果优于 BPG、WebP、JPEG2000 和 JPEG 等标准方式。
Mar, 2017
本研究提出了一种新型的 12 层深度卷积神经网络,用于图像压缩伪影抑制,其具有分层跳过连接和多尺度损失函数。相较于普通的 JPEG,可提高高达 1.79 dB 的峰值信噪比,并且相较于先前最佳 ConvNet 结果提高高达 0.36 dB。该研究表明,训练用于特定质量因子 (QF) 的网络对于压缩输入图像所使用的 QF 是有韧性的,单个针对 QF 60 训练的网络在多种 QF 范围内 (40 至 76) 提供超过 1.5 dB 的 PSNR 增益。
Nov, 2016
本研究提出一种基于卷积神经网络的端到端图像压缩框架,通过特征描述神经网络获取低维有效描述,借助标准图像编解码器进一步压缩图像后,再通过后处理神经网络消除失真和压缩留痕,最终通过虚拟编解码器神经网络通过反向传播优化整个系统。实验结果表明该方法在极低比特率下比当前现有算法性能更优。
Dec, 2017
本文提出一个基于深度学习和传统图像编解码器相结合的图像压缩框架并在 Kodak 和 Tecnick 数据集上进行实验,结果表明改进的分层压缩方案比现有方案和传统编解码器都表现更好,在 RGB444 中编码图像,无论在 PSNR 和 MS-SSIM 度量方面在广泛比特率范围内都有优异的表现。
Jul, 2019
本文提出了一种采用离散化高斯混合似然函数来参数化潜在代码分布的方法,并结合最近的注意力模块将其纳入网络架构中以增强性能。实验结果表明,我们提出的方法在 Kodak 和高分辨率数据集上都实现了最先进的性能,在 PSNR 方面与最新压缩标准 Versatile Video Coding(VVC)实现了可比较的性能,并且在经过 MS-SSIM 优化后,我们的方法生成了更加视觉上愉悦的结果。
Jan, 2020
应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题,通过训练一个特定的卷积神经网络,实现对图像语义的理解,并通过对每个对象训练特征的方式生成高质量的压缩图像。
Dec, 2016