Dec, 2021

VUT: 面向多模态多任务用户界面建模的通用 UI Transformer

TL;DR本研究提出了一种 VUT 多任务模型,可以同时完成 UI 镜像和结构编码、UI 对象检测、问题回答和命令接地等 5 个不同的任务。实验结果表明,VUT 在减少多任务模型数量和占用空间的同时,准确度也不逊于单独训练的基准模型。