Apr, 2024

语言模型中的真值判断:信念方向是上下文敏感的

TL;DR我们通过对大型语言模型的隐空间进行研究发现,先前的关于模型的 ' 知识 ' 或' 信念 ' 的研究方法可以基于其隐空间中的方向来构建探测器,而我们的实验结果表明这些探测器的预测可能与前面的(相关)句子有条件关联,并且这种信念方向可以影响推理过程中的真相判断和上下文信息的整合。