动态基于核的自适应空间聚合方法用于学习图像压缩

Aug, 2023

动态基于核的自适应空间聚合方法用于学习图像压缩

Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image Compression

Huairui Wang, Nianxiang Fu, Zhenzhong Chen, Shan Liu

TL;DR在本研究中，我们扩展了空间聚合能力并提出了一种动态内核的变换编码方法，使用自适应聚合产生内核偏移来捕获有效信息，同时引入了广义粗到细的熵模型和不对称的空间通道熵模型，实验结果表明我们的方法在三个基准测试中达到了优于最先进的基于学习的方法的速率失真性能。

Abstract

learned image compression methods have shown superior rate-distortion performance and remarkable potential compared to traditional compression methods. Most existing learned approaches use stacked convolution or window-based self-attention for →

learned image compression transform coding adaptive aggregation entropy model rate-distortion performance

发现论文，激发创造

动态空间稀疏化：用于高效视觉 Transformer 和卷积神经网络的优化

本文提出了一种通过利用视觉数据中的空间稀疏性进行模型加速的新方法，该方法基于所提出的动态令牌稀疏化框架，并通过自适应和不对称计算等方式推广到各种体系结构中，通过对不重要的特征使用轻量级快速路径和对更重要位置使用更具表现力的慢速路径，可以显著减少总体计算量，实验结果表明动态空间稀疏化为模型加速提供了新的更有效的解决方案。

Jul, 2022

多尺度和上下文自适应熵模型用于图像压缩

本文提出了一种端到端可训练的图像压缩框架，采用自回归和分层先验的组合估计每个潜在表示的分布，并使用一种方法将比特率分配到每个图像以最大化 MS-SSIM。

Oct, 2019

用于学习图像压缩的通道方向自回归熵模型

本研究介绍了两种增强技术：通道调节和潜在残差预测，提出了比现有上下文自适应模型更好的网络架构，该模型在最小化串行处理、保持数据完整性等方面都性能更优，在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下，本研究的模型可使速率提高 18%，比像 BPG 这样的手工工程编解码器提高 25%。

Jul, 2020

利用平铺深度网络的空间自适应图像压缩

用基于深度神经网络的质量敏感位速率自适应算法取代传统神经网络的定长空间位速率压缩算法，通过切块神经网络结构实现空间上下文预测，最终量化定量（PSNR）与定性（主观评估）评价得分优于其他基准模型。

Feb, 2018

学习图像和视频去噪的空间和时空像素聚合

本文提出了基于深度神经网络的空间像素聚合模型以及用于视频去噪的时空像素聚合模型，同时介绍了一种新的正则化项用于有效训练视频去噪模型，并证明了该方法在合成和实际数据上的表现优于现有的图像和视频去噪方法。

Jan, 2021

用于学习多频图像压缩的广义定标卷积

本文提出了基于 Octave 卷积的学习多频图像压缩和熵编码方法，将潜变量分解成高低分辨率分量，并通过新颖的广义 Octave 卷积结构减少了空间冗余，取得了超越标准编解码器与其他学习方法的压缩性能。此外，还演示了广义 Octave 卷积对于计算机视觉任务的性能提升效果。

Feb, 2020

学习内容加权深度图像压缩

本文提出一种内容加权的编码器 - 解码器模型，配合重要性掩模子网，通过局部自适应的比特率分配和控制方法，有效地进行学习型有损图像压缩，同时通过修剪的卷积神经网络实现对量化编码方法的有损压缩。实验证实该方法可以比深度和传统有损图像压缩方法获得更优成果。

Apr, 2019

学习动态风格核进行艺术风格转换

本研究提出了一种新的、灵活的样式迁移方法，通过学习空间自适应卷积核来改进全局和局部特征交互，同时保留内容图像的细节结构，并且通过 Style Alignment Encoding (SAE) 和 Content-based Gating Modulation (CGM) 模块学习动态样式卷积核，极大地提升了视觉质量和效率。

Apr, 2023

基于因果关系的上下文预测学习图像压缩

本文提出了一种基于序列解码过程的因果上下文熵预测的概念，以捕捉图像压缩的全局相关性和跨通道关系，同时，采用新的独立注意力模块构建更强的转换网络，实验结果表明，该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器，达到了最先进的码率失真性能。

Nov, 2020

神经编解码器中基于拉普拉斯的熵模型与模糊扩散合成

我们提出了一种使用非各向同性扩散模型的图像压缩框架，该模型在解码器端引入了一种感知偏差，以生成高质量图像。此外，我们还使用了一种新颖的熵模型来准确建模潜在表示的概率分布，并利用潜在空间中的空间通道相关性来加速熵解码。实验证明，我们的框架在感知质量上优于现有的生成模型编解码器，并且所提出的熵模型能够实现显著的比特率节省。

Mar, 2024