May, 2024

魔鬼的辩护:面向 LLM 代理的预期反思

TL;DR我们介绍了一种新颖的方法,为 LLM 智能体提供自省能力,以增强其在解决复杂任务中的一致性和适应性。我们的方法促使 LLM 智能体将给定的任务分解为可管理的子任务(即制定计划),并持续对其行动的适用性和结果进行自省。通过在 Web 环境中使用这种零样本方法进行实际任务的部署和实验,我们的智能体展示了优于现有零样本方法的性能。实验结果表明,我们的自省驱动方法不仅通过稳定的计划执行机制增强了智能体应对意外挑战的能力,而且通过减少试验和计划修订所需的次数,提高了任务的效率。