Jul, 2022

高效训练语言模型以填充中间部分

TL;DR通过在数据集中间将文本移动到末尾后,自回归语言模型可以学习填补文本,进行数据增强不会影响原始的生成性能,因此我们建议未来应默认使用填补法来训练自回归语言模型,我们通过对关键超参数的剖析,制定了强有力的默认设置和最佳实践。