BriefGPT.xyz
Ask
alpha
关键词
taskbench
搜索结果 - 1
TaskBench: 用于任务自动化的大型语言模型基准测试
最近,大型语言模型的不断进展引发了任务自动化的火花,其将用户指令描述的复杂任务分解为子任务,并调用外部工具执行它们,在自主代理中起着核心作用。然而,缺乏一个系统的和标准化的基准来促进 LLM 在任务自动化中的发展。为此,我们引入了 Task
→
PDF
7 months ago
Prev
Next