Jun, 2023

语言模型仍缺乏测谎器:探究经验和概念障碍

TL;DR我们考虑大型语言模型是否具有信念,以及如果它们确实具有信念,我们如何衡量它们。在评估两种现有方法失败后,我们认为即使 LLMs 具有信念,在概念上这些方法也不太可能成功。因此,还没有 LLMs 的测谎仪。我们总结了研究结果,并提出了一些未来工作的具体路径。