Sep, 2023

面向未来的原因,立即行动:可证明样本效率的自主 LLM 代理的原则框架

TL;DR认知大型语言模型(LLM)中,设计了一个名为 “为未来推理,为现在采取行动” 的框架(RAFA),通过在 LLMs 中结合学习和规划的过程,可以在最小交互次数内极大地提高推理能力,并在多个基准测试中得到了近乎完美的分数。