Feb, 2024

大型语言模型下游任务性能的缩放规律

TL;DR大型语言模型(LLMs)的缩放规律在设计中提供了重要的指导。本文研究了迁移学习中的缩放行为,探讨了预训练数据的选择和大小对下游性能的影响,并提供了选择适当的预训练数据的实用见解。