Oct, 2024

代理S:一个像人类一样使用计算机的开放代理框架

TL;DR本文提出了Agent S,一个开放的代理框架,通过图形用户界面实现与计算机的自主交互,旨在通过自动化复杂的多步骤任务来转变人机交互。研究解决了获取领域特定知识、长任务规划和动态非均匀界面处理三个关键挑战,提出了经验增强的分层规划,显示出在多个操作系统上的广泛泛化能力。