Aug, 2024

我们能依赖大型语言模型代理生成长远规划吗?以旅行规划者为例

TL;DR本研究填补了关于基于大型语言模型(LLM)代理在复杂现实规划任务中行为的知识空白。通过使用TravelPlanner基准,探讨了LLM代理在处理长文本和多重约束时的鲁棒性以及改进策略。研究发现,LLM在长规划分析中存在局限,但提出的反馈感知微调方法显著提高了性能,具有重要的应用潜力。