Oct, 2023

元工具基准:决定是否使用工具以及选择哪个工具

TL;DR本文提出了 MetaTool,这是一个用于评估大型语言模型(LLMs)的工具使用意识和正确选择工具能力的基准测试,并通过实验证明大多数 LLMs 在工具选择方面仍然存在困难。