BriefGPT.xyz
Ask
alpha
关键词
super-alignment problem
搜索结果 - 1
提升弱到强泛化性能的可靠性感知对齐
通过提高弱监督信号的可靠性,我们的方法有效地识别了弱标签的质量,并显著提高了弱到强泛化能力,降低了噪声监督的误差传播,增强了大型语言模型的准确性和可靠性。
PDF
9 days ago
Prev
Next