ICMLJun, 2024

揭示督导学习中信息互动的动态

TL;DR利用矩阵信息理论作为分析工具,本文研究了数据表示和分类头向量在监督学习过程中的信息交互动态,引入了矩阵互信息比率(MIR)和矩阵熵差比率(HDR)来评估数据表示和分类头在监督学习中的相互作用,并确定了当发生神经坍缩时 MIR 和 HDR 的理论最优值。实验结果表明,MIR 和 HDR 可以有效解释神经网络中发生的许多现象,例如标准监督训练动态、线性模式连通性以及标签平滑和修剪的性能。此外,将 MIR 和 HDR 引入监督和半监督学习中作为损失项,以优化样本和分类头之间的信息交互。实证结果证明了该方法的有效性,不仅有助于理解训练过程中的动态,还能增强训练过程本身。