May, 2023

特征坍塌

TL;DR本文研究了一种叫做特征坍塌的现象,即在学习任务中,扮演相似角色的元素会获得类似的表达方式,其中 LayerNorm 等规范化机制在特征坍塌和泛化中扮演着关键作用。通过在 NLP 任务中进行实验,证明了特征坍塌与泛化密切相关,并且在大样本极限下,相同角色的不同单词在神经网络中获得相同的局部特征表达。