Jan, 2023

生成混合模式语言模型的缩放定律

TL;DR研究了混合式语言生成模型的规模特性及其相互作用,提出了新的混合式扩展定律,并发现了四种训练现象和各种相互作用连接。