May, 2024

弱到强泛化的增益量化

TL;DR使用弱模型生成的标签对强模型进行微调可以显著提高强模型性能,本文提出了一个理论框架来解释这种弱到强的泛化现象,并通过多种实证评估验证了理论发现。