ICLRApr, 2024

自我训练语言模型的崩溃

TL;DR基于语言模型的自我训练方法在实践中存在实际限制,导致 GPT-2 模型的性能下降、输出重复并崩溃。