深度神经网络中的信息压缩表现：自适应估计器

ICLRFeb, 2019

深度神经网络中的信息压缩表现：自适应估计器

Adaptive Estimators Show Information Compression in Deep Neural Networks

Ivan Chelombiev, Conor Houghton, Cian O'Donnell

TL;DR此研究探讨神经网络采用信息瓶颈理论通过压缩神经网络表示来提高泛化性能。研究结果表明，激活函数的饱和状态并非压缩的必要条件。但是 L2 正则化可以显著增加压缩，同时防止过拟合。在多次正则化后，只有最后一层的压缩与泛化性能呈正相关关系。

Abstract

To improve how neural networks function it is crucial to understand their learning process. The information bottleneck theory of deep learning proposes that →

neural networks information bottleneck theory activation functions compression generalization

发现论文，激发创造

深度神经网络信息流估算

研究深度神经网络训练过程中信息流和内部表示的演化，旨在阐明信息瓶颈理论的压缩方面。通过引入辅助 DNN 框架并通过开发严格估算器观察不同模型的压缩现象，最终将隐藏表示的几何聚类确定为真正感兴趣的现象。

Oct, 2018

ResNet 压缩了哪些信息？

本文旨在测试信息瓶颈原理是否适用于更现实的场景，通过训练 ResNet 模型以衡量其隐藏层和输入图像数据之间的互信息，发现该原理适用于分类和自编码的两种训练模式，并且即使对于自编码器，也会发生压缩。通过通过观察隐藏层激活条件下的样本图像，提供了一种直观的视觉化方法来理解 ResNet 学习到的内容。

Mar, 2020

深度神经网络的信息瓶颈分析通过有损压缩

该研究利用 Information Bottleneck 原理和深度神经网络，采用互信息和压缩等技术，针对高维随机向量实现了对一般深度神经网络的信息瓶颈分析，并在一个近实际规模的卷积深度神经网络上揭示了互信息动态的新特征。

May, 2023

神经图像压缩的带宽有效推理

我们提出了一种端到端可微分的带宽高效神经推理方法，通过神经数据压缩方法对激活进行压缩，可实现高达 19 倍的带宽减少和 6.21 倍的能量节省。

Sep, 2023

利用变分信息瓶颈压缩神经网络

该论文研究了如何通过修剪神经元、信息瓶颈和稀疏正则化等方式来压缩神经网络模型，提高模型的精度和运行效率。在多个数据集和网络架构中展示了最先进的压缩率。

Feb, 2018

压缩还是不压缩 —— 自监督学习和信息理论：一篇综述

本文综述了信息理论、自监督学习和深度神经网络三者交叉领域的最新研究进展，提出了自监督信息理论学习问题的统一框架，并讨论了信息论量的经验测量和估算方法。

Apr, 2023

透过信息揭示深度神经网络的黑盒

本研究通过信息平面可视化深度神经网络，发现在标准深度学习中，大部分训练周期都用于对输入进行压缩以生成有效表示，而非适应标签，当训练误差变小并且随机梯度下降下降进入随机扩散阶段时，表征压缩阶段开始。隐藏层的加入可以极大的缩短训练时间。

Mar, 2017

深度神经网络中信息存储的位置在哪里？

通过测量深度神经网络中的信息与激活之间的有效信息，建立了信息复杂度与推广和不变性之间的新关系，并表明低信息复杂度的模型不仅能更好地推广，而且会学习到未来输入的不变表示。

May, 2019

基于熵的深度神经网络引导加速收敛与提升性能

通过引入基于熵的损失项，我们提出了一种新的方法来加强神经网络学习丰富的潜在数据表示，在更少的维度上收敛于更好的测试指标，并在图像压缩和图像分类的实验中展示了其有效性。

Aug, 2023

神经网络分类器信息平面分析 -- 综述

本文就信息平面分析、神经网络分类器、信息论压缩、潜在表示、互信息估计等方面的问题进行了综述和分析，研究发现信息压缩不一定与信息论有关，而是与潜在表示的几何压缩相容。此外还探讨了神经网络互信息估计的问题及其后果。

Mar, 2020