Mar, 2022

BERT 模型是否学会使用浏览器用户界面?通过统一的视觉 - 语言 BERT 模型探索多步骤任务

TL;DR本文探讨了一种结合图形用户界面(GUI)的预训练 Transformer 模型的框架,该框架可以通过多步骤的方式执行多个任务,使用 BERT 扩展来训练该模型,结果表明还有提高其泛化能力的空间。