BriefGPT.xyz
Nov, 2024
基础模型驱动的图形用户界面代理:全面综述
GUI Agents with Foundation Models: A Comprehensive Survey
HTML
PDF
Shuai Wang, Weiwen Liu, Jingxuan Chen, Weinan Gan, Xingshan Zeng...
TL;DR
本研究针对基础模型尤其是大型语言模型在图形用户界面代理中的应用进行了综述,填补了相关文献中对不同数据集、框架和应用的整合性分析的空白。文章提出了一种统一框架,展示了之前研究中的核心组件和分类法,并识别出关键挑战与未来研究方向,旨在推动该领域的进一步发展。
Abstract
Recent advances in
Foundation Models
, particularly
Large Language Models
(LLMs) and Multimodal
Large Language Models
(MLLMs), facilitate <
→