思维缓冲区: 利用大型语言模型进行思维增强的推理

Jun, 2024

思维缓冲区: 利用大型语言模型进行思维增强的推理

Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models

Ling Yang, Zhaochen Yu, Tianjun Zhang, Shiyi Cao, Minkai Xu...

TL;DR我们引入“思绪缓冲区”(Buffer of Thoughts，BoT)，这是一种新颖而多用途的思绪增强推理方法，可提高大型语言模型(Large Language Models，LLMs)的准确性、效率和鲁棒性。通过引入元缓存器(meta-buffer)来存储一系列信息丰富的高级思维模板，我们能够从各种任务的问题解决过程中抽取思维模板。然后，对于每个问题，我们检索相关的思维模板，并灵活地用具体的推理结构来实例化它，以进行高效的推理。为了保证可扩展性和稳定性，我们进一步提出了缓冲器管理器(buffer-manager)来动态更新元缓存器，从而增强元缓存器的容量以适应更多的任务。我们对10个具有挑战性的推理密集型任务进行了大量实验，与之前的最先进方法相比，取得了显著的性能改进：24点游戏提升11%、几何形状提升20%、以及一步将军提升51%。进一步分析显示了我们的BoT具有优越的泛化能力和模型鲁棒性，而平均只需要多查询提示方法的12%成本(例如，思维树/图)。值得注意的是，我们发现我们的Llama3-8B+BoT具有超越Llama3-70B模型的潜力。我们的项目网址为：https://example.com

Abstract

We introduce buffer of thoughts (BoT), a novel and versatile thought-augmented reasoning approach for enhancing accuracy, efficiency and robustness of →

发现论文，激发创造

利用大型语言模型进行忠实推理

通过串联使用微调语言模型进行多步推理的方法，可以解决大型语言模型的单次调用限制，提高多步问题的性能和可解释性。该方法在多步逻辑推导和科学问题回答方面表现优于基线模型，并生成可由用户检查的有效推理过程。

Aug, 2022

ThinkSum：使用大型语言模型进行集合上的概率推理

提出了一个两阶段概率推理模型，ThinkSum，用于大语言模型的推理和理解。ThinkSum能够对多个对象或事实进行结构化推理和引用，并在BIG-bench评估任务中取得了改进成果。

Oct, 2022

大语言模型的推理能力：一项调查

本文综述了大型语言模型在推理方面的最新研究，包括提高它们的推理能力的方法、评估它们的推理能力的基准和方法，以及这一领域之前研究的发现和意义，旨在激发有意义的讨论和未来的研究。

Dec, 2022

ChatCoT：基于聊天的大型语言模型的工具增强思维链推理

ChatCoT是一种用于聊天式大语言模型的工具辅助思维链推理框架，大幅提高了在复杂推理任务上的表现。

May, 2023

思维链中枢: 评估大型语言模型推理性能的持续努力

提出了一个开源评估套件链式思维中心，用于评估大型语言模型在多步推理能力方面的性能，并针对一系列有挑战性的应用场景提供基准测试，目前的结果表明，模型规模与推理能力密切相关，需要更多开源社区的努力来构建更好的基础模型和探索RLHF。

May, 2023

通过新框架提升大型语言模型中的逻辑推理能力：思维图

利用Graph of Thoughts (GoT)和prompting engineering技术，我们的方法在解决多步骤逻辑推理问题方面超越了GPT-4，分别获得了89.7%、86%和56%的准确率提升，并且相较于最先进的Tree of Thought (ToT)方法，我们的方法在准确率上平均提升了23%、24%和15%。

Aug, 2023

思维图：用大型语言模型解决复杂问题

Graph of Thoughts (GoT) is a framework that advances prompting capabilities in large language models (LLMs) by modeling LLM thoughts as an arbitrary graph, enabling combination, distillation, and enhancement of thoughts, offering advantages over existing paradigms and allowing for extensibility with new thought transformations.

Aug, 2023

思维算法：增强大型语言模型中的想法探索

我们提出了《Algorithm of Thoughts》，这是一种新的通过算法推动大型语言模型的算法推理路径的策略，以在上下文学习中扩展其思路探索，并超越了早期单查询方法和最近的多查询策略。

Aug, 2023

思维传播：以类比方式进行复杂推理的大型语言模型

Thought Propagation (TP) leverages insights from solving analogous problems to enhance the complex reasoning ability of Large Language Models (LLMs), achieving substantial improvements in finding optimal solutions, human preference in creative writing, and task completion rate of LLM-Agent Planning.

Oct, 2023

思维的提升：利用大型语言模型进行试错问题解决

通过迭代地探索和自我评估许多思维树以获得试错推理经验集，我们提出了一种用于LLMs问题解决的自动提示框架BoT，它将作为一种新形式的提示来解决复杂的问题。实验证明，BoT在解决复杂数学问题时，与其他先进的提示方法相比，可以达到更高或相当的问题解决率。

Feb, 2024