Jul, 2023

自我学习方法:引入最小指导调整的提前停止准则

TL;DR本文引入了指令追踪评分(IFS)这一度量标准,用于检测语言模型遵循指令的能力。我们通过基准测试公开可用的基础模型和指令模型,并展示了格式良好回应与部分和完整句子之间的比例可以作为这两类模型之间有效的衡量指标。此外,我们还利用 IFS 作为指令调整的早停准则,在 7B 和 13B LLaMA 模型的监督微调中计算 IFS,结果表明模型在训练过程中相对早期就学会了遵循指令,并且进一步微调可以导致基础模型语义的变化。我们通过一个辅助标准 ObjecQA 来展示模型预测的客观性的变化。我们展示了在这种情况下 IFS 趋于平稳时语义变化最为显著。我们希望将指令调整分解为 IFS,以便更好地处理和理解。