Feb, 2024

忽略不计:大型语言模型中的指令覆盖和调控

TL;DR最近的大型语言模型在指令遵循的冲突情况下进行了调查和基准测试,对比了最流行的专有模型和不同大小的开源模型。实验表明,较大的模型在遵循指令方面表现最佳,并且对内部和上下文指令具有覆盖能力。然而,在进行长上下文的缩放时需要保持与困惑度边缘的显著缓冲区,以保持指令遵循能力。此外,提高指令遵循与遵循给定安全过滤器或指南的能力相互冲突,因此我们认为处理安全可信人工智能的最有效方法应该是在语言模型之外进行。