EMNLPJan, 2023

Lexi: UI 语言的自监督学习

TL;DR本研究探索如何利用 UI 说明书中的图像来学习 UI 屏幕及其组件的通用视觉 - 语言表示,并提出了一种名为 Lexi 的预训练模型,该模型可处理 UI 屏幕的独特特点,包括其丰富的文本和上下文敏感性。通过创建包含 114k UI 图像及其功能描述的 UICaption 数据集,我们证明了该模型可用于 UI 行动蕴含和 UI 实体识别等任务。