- 高效神经压缩与推理时间解码
通过混合精度量化、零点量化和熵编码将 Resnets 的压缩边界推进到 1 位以外,在 ImageNet 基准测试中准确度下降不超过 1%。
- 基于行级注意力的高光谱图像的深度无损和近无损预测编码
本文提出了一种新型预测神经网络 LineRWKV,利用 Transformer 的表示优势和递归神经网络的线性复杂度和递归实现,来压缩航天器上的高光谱图像,并在 HySpecNet-11k 数据集和 PRISMA 图片上进行实验证明了 Li - 分布式神经网络中熵模型的弹性
通过实验证明,熵攻击可以增加传输开销高达 95%,提出一个新的防御机制,可以将受攻击输入的传输开销减少约 9%,只有约 2% 的准确度损失,并提出该防御机制可以与对抗训练等方法结合使用以进一步提高鲁棒性。
- 使用门控循环卷积神经网络对医学图像进行流式无损体积压缩
该论文介绍了一种基于深度学习的无损压缩方法,针对医学体积图像提出了一个只需要其他学习型压缩方法的千分之一的模型权重的硬件友好流式无损体积压缩框架,通过融合不同的卷积结构和门控循环卷积神经网络机制来捕捉切面间的依赖关系,并基于这样的上下文信息 - MMVC: 带有基于块预测模式选择和密度自适应熵编码的学习多模式视频压缩
本研究提出了多模式视频压缩(MMVC)框架,通过深度学习和区块式模式集成选择最佳模式来适应各种动作模式和熵模型,包括 ConvLSTM,光流条件化特征域预测和特征传播,通过对空间块进行时间预测,以最大程度地减少数据的冗余和失真。实验表明,与 - 神经分布式图像压缩与交叉注意特征对齐
本文介绍了一种新的编解码方法,可以压缩成对立体图像并利用解码器端的相关性附加信息,以更有效地重构图像。该算法利用了交叉注意力模块对齐处理相关特征图,实验验证了其在 KITTI 和 Cityscape 数据集上的优越性能。
- 图像压缩的隐式神经表示
本文从图像压缩的角度出发,探索了 INRs 的作用,提出了基于 INRs 的全面压缩流水线并进行了广泛的消融研究,结果表明,该方法表现优异,且与专门为图像设计的常用压缩算法竞争力相当,接近基于率失真自编码器的最新学习方法。
- CVPR基于八叉树的点云压缩框架:VoxelContext-Net
提出了 VoxelContext-Net 两阶段深度学习框架,利用体素和八叉树方法对静态和动态点云进行压缩,使用体素环境压缩八叉树结构数据,通过熵编码来压缩非叶节点符号的深度熵模型。
- 利用多尺度运动补偿和时空上下文模型的神经视频编码
本文提出了一种基于深度神经网络编码的新方法。通过利用多尺度的运动补偿网络进行大范围运动的估计和补偿,同时采用自适应空时上下文模型进行高效熵编码,采用非局部注意力模块进行特征聚合和激活,通过对多模块的优化和多帧训练策略进行时间误差的最小化,最 - ICLRIDF++:整数离散流的分析与改进以实现无损压缩
本文研究和改进针对无损压缩的整数离散流。我们通过探究离散随机变量的可逆流是否比连续随机变量的更为灵活来开始分析,并通过证明发现此理论不适用于整数离散流。此外,我们研究了整数离散流中的梯度偏差效应,并通过实验证明其对模型的性能影响高度依赖于架 - 深度点云几何压缩的改进
本文提出了一系列改进点云压缩的方法,包括使用尺度先验模型进行熵编码、采用更深的变换、不同的 focal loss 权重、最优解码阈值和连续模型训练,并通过实验验证这些方法可以带来较好的 BD-PSNR 提升。
- 通过超分辨率进行无损图像压缩
介绍了一种简单高效的无损图像压缩算法,存储低分辨率版本,再经过多次无损超分辨率加工,采用熵编码来压缩超分辨率操作符,能够在大型数据集上以实用的运行时间实现最先进的压缩率。
- CVPR利用有损压缩进行更好的无损压缩学习
利用 BPG 算法实现了一种损耗压缩图像的方法,该方法使用卷积神经网络模型对残差进行无损编码,通过与之前的学习方法以及 PNG、WebP、JPEG2000 进行比较,实现最先进的无损全分辨率图像压缩效果。
- AAAI用于学习多频图像压缩的广义定标卷积
本文提出了基于 Octave 卷积的学习多频图像压缩和熵编码方法,将潜变量分解成高低分辨率分量,并通过新颖的广义 Octave 卷积结构减少了空间冗余,取得了超越标准编解码器与其他学习方法的压缩性能。此外,还演示了广义 Octave 卷积对 - 基于联合时空相关性探索的学习型视频压缩
本文提出使用一阶光流和二阶流预测来利用时间相关性进行视频编码,采用一阶段学习方法将流作为连续帧的量化特征包装,然后利用联合空间 - 时间先验条件下的适应性上下文熵编码,并使用 ConvLSTM 逐层嵌入联合先验,分别从自回归空间邻居、共位置 - 非局部关注优化的深度图像压缩
本文提出了一种基于自动编码器的新型非局部注意力优化深度图像压缩(NLAIC)框架,该框架将非局部操作嵌入编码器和解码器中,以捕捉局部和全局关联,并应用注意机制生成用于加权图像和超先验特征的掩码,从而根据其重要性隐含地适应不同特征的比特分配。 - 基于压缩感知的图像压缩:端到端与 JPEG 的比较
基于压缩感知的端到端图像压缩系统,结合传统压缩采样重建、量化和熵编码,可与 JPEG 相媲美,在低码率下表现显著优越。通过研究影响系统性能的参数,我们提出了一种有效的方法来联合控制量化步长和压缩比,以实现在任何给定比特率下达到接近最优的质量 - CVPR透過递归神经网络实施全解析度图像压缩
通过神经网络构建一套高效率图像压缩方法,新架构由编码器、解码器、二值化器和熵编码神经网络组成,可变压缩比率,能在感知度量上对 JPEG 进行改善,并取得了最好的表现。
- 非对称数字系统:将 Huffman 编码的速度与算术编码的压缩比结合的熵编码
这篇论文讨论了数据压缩中两种熵编码方法的优缺点,并介绍了一种新的方法 —— 非对称数字系统熵编码,它可以在保证压缩率的同时提高解码速度,相当于在速度和效率之间找到了平衡点。
- 非对称数码系统
本文提出了一种新的熵编码方法:将等概率符号序列编码到对称数位系统中,这些系统是用于自由选择符号概率分布的最优系统,它类似于范围编码,但是我们将符号范围均匀分布在整个区间中;此方法非常通用 - 我们可以从极其精确的编码(ABS)到极其快速的编