Mar, 2024

NL-ITI:优化探测和干预以改进 ITI 方法

TL;DR大型语言模型容易返回虚假信息,为了解决这个问题,该研究探索了一种介入推理时间的范式,引入了非线性探测和多标记介入方法,称之为 Non-Linear ITI。该方法在多种多项选择基准测试中取得了鼓舞人心的结果,并且在与其他基线和模型相比的实验中表现得更为非侵入性。