BriefGPT.xyz
Ask
alpha
关键词
computer tasks
搜索结果 - 2
OSWorld: 多模态代理在真实计算机环境中的开放式任务评测
通过引入 OSWorld,我们创建了一个包含 369 个计算机任务的基准,以评估多模态代理在开放领域中执行任意应用程序所涉及的计算机任务的能力。在 OSWorld 上进行的全面评估为开发多模态通用代理提供了宝贵的洞见,这是以前的基准测试无法
→
PDF
3 months ago
语言模型能解决计算机任务
本研究展示了一种使用 RCI 方法来自然语言执行计算机任务的代理方法,此方法能够显著提高计算机任务的自动化表现,优于现有的自然语言处理方法,并在自然语言推理任务中表现出较好的推理能力。
PDF
a year ago
Prev
Next