BriefGPT.xyz
Feb, 2024
如何培训数据高效的LLMs
How to Train Data-Efficient LLMs
HTML
PDF
Noveen Sachdeva, Benjamin Coleman, Wang-Cheng Kang, Jianmo Ni, Lichan Hong...
TL;DR
通过数据的有效利用,我们研究了大型语言模型的训练,提出了基于数据选择的技术并优化了模型质量和训练资源的消耗。我们的方法能在最大程度上提高覆盖率和多样性,同时以高效的方式训练模型。
Abstract
The training of
large language models
(LLMs) is expensive. In this paper, we study
data-efficient approaches
for
pre-training
LLMs, i.e.,
→