Jun, 2024

提升弱到强泛化性能的可靠性感知对齐

TL;DR通过提高弱监督信号的可靠性,我们的方法有效地识别了弱标签的质量,并显著提高了弱到强泛化能力,降低了噪声监督的误差传播,增强了大型语言模型的准确性和可靠性。