Jan, 2025

UI-TARS:开创自动化图形用户界面互动的新模式

TL;DR该研究针对现有依赖于复杂商业模型的图形用户界面代理框架不足进行了探索,提出了一种全新的原生图形用户界面代理模型UI-TARS。其核心创新包括增强的感知能力和统一的行动建模,使其在多项图形用户界面代理基准测试中达到最佳性能,具有重要的潜在影响,能够以更少的人为干预不断适应和学习。