Feb, 2024

对齐更长时间:一种简单但难以打败的教学微调基准

TL;DR在对指令微调的研究中,最长指令的选择应该是任何研究的默认基线,因为经证实此方法能够在 LLMs 中提高性能,保持与对事实的知识进行测试的 OpenLLM 基准的竞争力。