Mar, 2024

动物园中的 Android: GUI 代理的行动思维链

TL;DR通过描述以前的操作、当前屏幕和选择操作所导致的结果的操作思考,Chain-of-Action-Thought 架构与大型语言模型相结合,在智能手机上实现了通过自然语言触发的任务完成,显著提高了目标进展。