Sep, 2023
面向未来的原因,立即行动:可证明样本效率的自主 LLM 代理的原则框架
Reason for Future, Act for Now: A Principled Framework for Autonomous LLM Agents with Provable Sample Efficiency
Zhihan Liu, Hao Hu, Shenao Zhang, Hongyi Guo, Shuqi Ke...
TL;DR认知大型语言模型(LLM)中,设计了一个名为 “为未来推理,为现在采取行动” 的框架(RAFA),通过在 LLMs 中结合学习和规划的过程,可以在最小交互次数内极大地提高推理能力,并在多个基准测试中得到了近乎完美的分数。