Mar, 2024

在 Imaginarium 中的 LLMs: 通过模拟试错学习工具

TL;DR提出了一种仿生的方法,即模拟试错(STE),通过协调三个关键机制:试错、想象和记忆,为工具增强的大型语言模型(LLMs)提供成功使用工具的行为。通过在 ToolBench 上进行的综合实验,证明 STE 在上下文学习和微调设置下显著改善了 LLMs 的工具学习,为 Mistral-Instruct-7B 带来了 46.7% 的提升,并使其胜过 GPT-4。同时还展示了通过简单的经验重放策略有效地进行工具的持续学习。