Jul, 2024

大型语言模型中的Transformer对齐

TL;DR通过分析38个开放可用的大型语言模型,我们发现Residual Jacobians的左右奇异向量的对齐、线性化和层次指数增长等现象与模型性能正相关,这些重要发现揭示了以往被忽视的显著规律,加强了对LLM体系结构的动态解释,并为进一步理解和优化LLM体系结构铺平了道路。