Feb, 2024

微调、提示、上下文学习和指导微调:我们需要多少标记样本?

TL;DR在本研究中,我们旨在调查专用模型需要多少标记样本才能达到优越性能,同时考虑结果方差。我们通过观察提示、上下文学习、微调和指令调整的行为,确定它们在增加不同复杂度任务的标记训练样本数量时的平衡点,发现专用模型通常只需要少量样本(100-1000)就能达到或超越通用模型。与此同时,所需的标记数据量强烈依赖于任务复杂度和结果方差。