ICLRSep, 2022

移动界面理解:利用视觉 - 语言模型并聚焦

TL;DR本文提出了一种仅基于移动 UI 的截图进行 UI 建模的方法,命名为 Spotlight,该方法的表现优于使用截图和视图层次结构的方法,并且具有多任务学习和少样本学习能力。