高效深度图像压缩的统一端到端框架
本文提出了一种基于深度学习模型的视频压缩方法,其中利用神经网络的非线性表征能力和学习基于光流估计获取运动信息并重构当前帧的方法,同时采用两个 auto-encoder 风格的神经网络来压缩相应的运动和残差信息以共同优化所有组件,并通过单一损失函数来一起考虑减少压缩比特数和提高解码视频质量之间的权衡,实验证明该方法在 PSNR 方面优于广泛使用的 H.264 视频编码标准,在 MS-SSIM 方面甚至与最新的标准 H.265 相当。
Nov, 2018
本文提出了基于卷积神经网络的图像压缩框架,其中包括用于压缩的紧凑型 CNN 和用于重构压缩图像的重构型 CNN,开发了一种统一的端到端学习算法以有效协同两种 CNN,并与现有的图像编码标准兼容。实验结果表明,所提出的压缩框架大大优于使用现有图像编码标准的多种压缩框架。
Aug, 2017
本文提出一种名为 Deep Semantic Image Compression (DeepSIC) 的概念,提出两种新颖的架构,旨在重构压缩图像并同时生成相应的语义表示。在编码过程中,第一架构通过将一部分比特保留在压缩编码中存储语义表示进行语义分析。第二种在解码过程中使用嵌入到压缩码中的特征映射进行语义分析。通过在公开数据集上进行实验,验证本文的方法,并对所提出技术的优缺点进行了彻底分析。
Jan, 2018
本文提出了一种文字引导图像压缩的多模态机器学习方法,通过使用文本的语义信息来引导图像压缩,以实现更好的压缩性能,包括采用图像 - 文本注意力模块和改进的多模态语义一致性损失函数。实验证明,该方法能够在极低比特率下获得较好的视觉效果,并且即使与最先进的技术相比,其性能也可以相媲美或超越。
Apr, 2023
本文提出了一种基于可逆神经网络(INNs)的 Invertible Encoding Network 方法来构建更好的图像空间和潜在特征空间之间的转换,并在 Kodak、CLIC 和 Tecnick 数据集上证明了该方法在高分辨率图像方面优于现有的学习图像压缩方法和压缩标准(包括 VVC (VTM 12.1))的实验结果。
Aug, 2021
本文提出了一种基于不均匀通道条件自适应编码的图像压缩算法,并通过该算法结合现有的上下文模型,提出了一种空间 - 通道上下文自适应模型,用于提高编码性能,同时保持了运行速度,同时还提出了一种高效的模型 ELIC,达到了最先进的速度和压缩能力。
Mar, 2022
本论文提出了一种基于深度语义分割的分层图像压缩 (DSSLIC) 框架,通过将输入图像的语义分割映射编码为比特流的基本层,并生成编码为第一个增强层的输入图像的紧凑表示,进而获得图像的粗略重构,并额外编码作为另一种增强层与输入图像的差值,该框架可以在 RGB 域的广泛比特率中在 PSNR 和 MS-SSIM 指标方面优于 H.265/HEVC-based BPG 和其他编解码器,并用于图像搜索和基于对象的自适应图像压缩等多项任务。
Jun, 2018
本文提出了一种基于神经网络的编解码及任务模型的联合训练方法,用于实现远程机器任务分析的图像压缩,研究表明,进行编解码和任务网络的联合优化可以显著提高任务准确性,在训练和部署的限制下,可以选择性地进行编码器、解码器或任务网络的微调,并仍然实现高于现成解决方案的速率和准确度。
Nov, 2020
该研究提出在深度神经网络图像压缩编码产生的图像压缩表示基础上直接进行图像分类、分割等理解任务,验证了这种方法可以大幅降低计算成本并保证相近的识别准确率,并且联合训练压缩网络和分类网络可以提高图像质量、分类精度和分割性能。
Mar, 2018
本研究提出一种基于卷积神经网络的端到端图像压缩框架,通过特征描述神经网络获取低维有效描述,借助标准图像编解码器进一步压缩图像后,再通过后处理神经网络消除失真和压缩留痕,最终通过虚拟编解码器神经网络通过反向传播优化整个系统。实验结果表明该方法在极低比特率下比当前现有算法性能更优。
Dec, 2017