Jun, 2024

MobileAgentBench: 移动 LLM 代理的高效且用户友好的基准测试

TL;DR通过提出 MobileAgentBench 这一高效且用户友好的基准测试工具,对现有移动代理进行全面和系统性的性能比较,以解决应用程序状态无穷和可行操作序列定义模糊的挑战。