May, 2023

利用自然语言解释缩放人类判断

TL;DR本文提出了一种利用自然语言解释对大型语言模型进行训练的方法,通过收集一致性注释来标记数据,以及利用该方法对大型语言模型进行训练,从而提高标注数据的质量。