Mar, 2024

LLM能将指令与数据分离吗?我们用这个说法究竟是什么意思?

TL;DR我们介绍了一种量化指令和数据分离现象的形式化测量方法,以及可以从模型的黑盒输出计算的经验性变量。我们还引入了一个名为SEP(应该执行还是处理?)的新数据集,并对几种最先进的开源和闭源大语言模型进行了测试。最后,我们定量证明所有评估的大语言模型都无法实现高度的分离,根据我们的测量方法。