Apr, 2023

Pythia:用于分析大规模语言模型在训练和扩展方面的工具集

TL;DR介绍了 16 个大小从 70M 到 12B 参数的大型语言模型套件 Pythia,旨在促进在语言模型和训练动态中的研究,包括记忆化、少样本性能的术语频率效应和减少性别偏见等方面的结果。