动态基于核的自适应空间聚合方法用于学习图像压缩
本文提出了一种通过利用视觉数据中的空间稀疏性进行模型加速的新方法,该方法基于所提出的动态令牌稀疏化框架,并通过自适应和不对称计算等方式推广到各种体系结构中,通过对不重要的特征使用轻量级快速路径和对更重要位置使用更具表现力的慢速路径,可以显著减少总体计算量,实验结果表明动态空间稀疏化为模型加速提供了新的更有效的解决方案。
Jul, 2022
本文提出了一种端到端可训练的图像压缩框架,采用自回归和分层先验的组合估计每个潜在表示的分布,并使用一种方法将比特率分配到每个图像以最大化 MS-SSIM。
Oct, 2019
本研究介绍了两种增强技术:通道调节和潜在残差预测,提出了比现有上下文自适应模型更好的网络架构,该模型在最小化串行处理、保持数据完整性等方面都性能更优,在 Kodak 和 Tecnick 图像集上的平均速率提高了 6.7% 和 11.4%。在低比特率下,本研究的模型可使速率提高 18%,比像 BPG 这样的手工工程编解码器提高 25%。
Jul, 2020
用基于深度神经网络的质量敏感位速率自适应算法取代传统神经网络的定长空间位速率压缩算法,通过切块神经网络结构实现空间上下文预测,最终量化定量(PSNR)与定性(主观评估)评价得分优于其他基准模型。
Feb, 2018
本文提出了基于深度神经网络的空间像素聚合模型以及用于视频去噪的时空像素聚合模型,同时介绍了一种新的正则化项用于有效训练视频去噪模型,并证明了该方法在合成和实际数据上的表现优于现有的图像和视频去噪方法。
Jan, 2021
本文提出了基于 Octave 卷积的学习多频图像压缩和熵编码方法,将潜变量分解成高低分辨率分量,并通过新颖的广义 Octave 卷积结构减少了空间冗余,取得了超越标准编解码器与其他学习方法的压缩性能。此外,还演示了广义 Octave 卷积对于计算机视觉任务的性能提升效果。
Feb, 2020
本文提出一种内容加权的编码器 - 解码器模型,配合重要性掩模子网,通过局部自适应的比特率分配和控制方法,有效地进行学习型有损图像压缩,同时通过修剪的卷积神经网络实现对量化编码方法的有损压缩。实验证实该方法可以比深度和传统有损图像压缩方法获得更优成果。
Apr, 2019
本研究提出了一种新的、灵活的样式迁移方法,通过学习空间自适应卷积核来改进全局和局部特征交互,同时保留内容图像的细节结构,并且通过 Style Alignment Encoding (SAE) 和 Content-based Gating Modulation (CGM) 模块学习动态样式卷积核,极大地提升了视觉质量和效率。
Apr, 2023
本文提出了一种基于序列解码过程的因果上下文熵预测的概念,以捕捉图像压缩的全局相关性和跨通道关系,同时,采用新的独立注意力模块构建更强的转换网络,实验结果表明,该系统在 Kodak 数据集上的表现优于标准 VVC/H.266 编解码器,达到了最先进的码率失真性能。
Nov, 2020
我们提出了一种使用非各向同性扩散模型的图像压缩框架,该模型在解码器端引入了一种感知偏差,以生成高质量图像。此外,我们还使用了一种新颖的熵模型来准确建模潜在表示的概率分布,并利用潜在空间中的空间通道相关性来加速熵解码。实验证明,我们的框架在感知质量上优于现有的生成模型编解码器,并且所提出的熵模型能够实现显著的比特率节省。
Mar, 2024