May, 2024

Seal-Tools: 自助工具学习数据集用于代理调整和详细基准测试

TL;DR本研究提出了一个新的工具学习数据集 Seal-Tools,它包含了自学习的类似 API 的工具。通过提供大量的工具和实例,Seal-Tools 不仅能实现数据的大规模生成,还能展示工具的实际应用。为了确保可靠性,我们提出了一种自学习方法来生成工具和实例,使得过程能够被精确控制。此外,Seal-Tools 包含一些难度较高的实例,其中有些实例需要调用多个嵌套的工具来完成任务。为了进行精确和综合的评估,我们采用了严格的格式控制,并从不同角度设计了三个评估指标。因此,Seal-Tools 可以作为评估 LLMs 的工具调用能力的新基准。最后,我们在 Seal-Tools 上评估了几种流行的 LLMs 和我们微调的模型。结果表明当前的系统还远未达到完美。解码、数据和实验结果可在此链接获取。