BriefGPT.xyz
大模型
Ask
alpha
关键词
complex environment
搜索结果 - 1
大型语言模型能够在网络代理任务上进行自我改进
通过在复杂环境中使用 WebArena 基准测试,我们探索了大语言模型在长期任务中作为代理人自我提升性能的程度,通过自我改进的方式,在三种不同的合成训练数据混合情况下,我们实现了在 WebArena 基准测试中任务完成率的 31%提高,并额
→
PDF
a month ago
Prev
Next