Sep, 2024

无需指令调优的指令跟随

TL;DR本研究解决了在语言模型指令跟随过程中依赖于指令响应对的不足问题。通过提出新的隐式指令调优方法,发现仅通过响应训练模型仍能实现指令跟随,且在不同领域的训练中,模型能够展现出广泛的指令遵循行为。研究表明,简单调整语言模型的分布即可实现指令跟随,为未来模型适应性发展提供了新视角。