Oct, 2022

通过子种群分析理解语言模型中的领域学习

TL;DR通过基于子群分析和奇异向量标准相关分析(SVCCA)的一种主要分析工具,我们研究了现代神经网络体系结构中如何对不同的领域进行编码。我们发现增加模型容量会以不同的方式影响领域信息在不同层中的存储,并且较大的实验模型同时嵌入特定于领域的信息,就像它们是联合的对照模型一样。