Feb, 2024

再思限制 LLM 推理的边界:多智能体讨论是关键吗?

TL;DR通过系统实验,本研究通过提出一种新的群组讨论框架来重新评估多代理讨论对 LLMs 推理能力的改进,并发现,在广泛的推理任务和基于骨干的 LLMs 上,具有强提示的单一代理 LLM 几乎与最佳现有讨论方法表现一致。我们观察到,当提示中没有示范时,多代理讨论的表现优于单一代理,进一步研究揭示了 LLMs 在讨论过程中的常见互动机制。