Jan, 2024

易训练数据在困难任务中的非常有效性

TL;DR通过对容易和困难数据进行简单的训练方法、线性分类器头和 QLoRA 的易变难泛化,以及使用不同硬度度量的实验验证,我们得出了在语言模型中易变难泛化意外地很强,表明可扩展的监管问题可能比之前认为的更容易。