Apr, 2024

深度学习中的信息平面分析可视化通过传递熵

TL;DR在一个前馈网络中,可以使用传递熵(TE)来衡量一层对另一层的影响,通过在训练期间量化它们之间的信息传递。通过在输入数据中的信息量与压缩表示之间绘制图表来理解信息瓶颈方法中压缩和信息保留之间的权衡,这被称为信息平面分析。我们使用 TE 来量化神经层之间的信息传输,并进行信息平面分析以探索信息理论压缩和泛化之间的因果关系。我们获得了令人鼓舞的实验结果,为进一步研究打开了可能性。