May, 2024

完美拟合对表示学习的影响:深度神经网络中的表示训练动态

TL;DR通过揭示深度神经网络(DNNs)在训练过程中的演变,本文重点关注在过度参数化学习环境下,训练持续进行的情况,探讨了学习表示的演变以及层级之间的相似性和线性分类器探针的相似度等指标,并发现了与相对层级深度、DNN宽度和架构有关的训练动态模式。同时,对Vision Transformer进行了研究,展示了完美拟合阈值在编码器块中表示演变方面的转变。