Jun, 2024

VideoGUI: 从教学视频中的 GUI 自动化基准

TL;DR通过视频 GUI 评估可视化导向的图形用户界面 (GUI) 任务上 GUI 助手的表现,并发现当前最先进的大型多模态模型 GPT4o 在高级规划方面表现不佳。