Jun, 2024

遵循指导中的长度限制

TL;DR训练能够在推断时受到长度约束的指令控制模型,通过指令被控制的长度评估表现优于标准的指令跟随模型,如 GPT4、Llama 3 和 Mixtral。