Aug, 2024

大型语言模型能够推理吗?通过3-SAT进行特征描述

TL;DR该研究解决了大型语言模型(LLMs)真实推理能力的评估问题,表明现有方法可能因训练数据偏差而导致结果失真。研究采用3-SAT这一经典NP完全问题,从计算理论角度出发,考察了LLMs的推理能力,发现其在解决3-SAT问题时无法进行真正的推理。该发现对理解LLMs的局限性具有重要意义。