BriefGPT.xyz
Ask
alpha
关键词
easy-to-hard generalization
搜索结果 - 2
易于困难泛化:超越人类监督的可扩展对齐
通过从易到难的泛化和评估者的使用,本文提出一种可扩展的 AI 对齐方法,用于解决超越人类监督水平的困难推理任务,提升生成器模型在数学问题上的准确率。
PDF
4 months ago
易训练数据在困难任务中的非常有效性
通过对容易和困难数据进行简单的训练方法、线性分类器头和 QLoRA 的易变难泛化,以及使用不同硬度度量的实验验证,我们得出了在语言模型中易变难泛化意外地很强,表明可扩展的监管问题可能比之前认为的更容易。
PDF
6 months ago
Prev
Next