Jun, 2024

从启发法到理性:语言模型推理的动态启发法使用

TL;DR语言模型在多步推理中在早期阶段更依赖于启发式方法,包括词汇重叠,但随着接近最终答案,启发式方法的依赖程度减少,语言模型动态结合启发式和逻辑策略进行多步推理任务。