Jun, 2024

CAAP: 前端 UI 下的上下文感知行动规划引导解决计算机任务

TL;DR基于大型语言模型的自动化机器人可以在无需 HTML 源代码的基础上仅通过屏幕截图识别环境,利用上下文学习来消除数据收集需求,在自动化代理领域取得了重大的进展,尤其适用于需要在计算机或智能手机上进行应用间协调的任务。