Jun, 2024
CAAP: 前端 UI 下的上下文感知行动规划引导解决计算机任务
CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only
Junhee Cho, Jihoon Kim, Daseul Bae, Jinho Choo, Youngjune Gwon...
TL;DR基于大型语言模型的自动化机器人可以在无需 HTML 源代码的基础上仅通过屏幕截图识别环境,利用上下文学习来消除数据收集需求,在自动化代理领域取得了重大的进展,尤其适用于需要在计算机或智能手机上进行应用间协调的任务。