Oct, 2020

利用信息理论研究深度神经网络的因果结构

TL;DR本文提出了一种度量深度神经网络在训练过程中因果结构的度量方法,即有效信息(EI),用于评估每个层的因果影响节点和边缘在其下游目标上的度量。通过分解 EI 以检查每个层的敏感性、退化性和整合信息量,可以在 “因果平面” 上可视化每个层次的连接方式如何随时间变得更加敏感或退化,以及集成如何在训练期间改变。结果有助于理解深度神经网络的泛化能力,并为使 DNN 具有更高的泛化性和可解释性提供基础工具。