EMNLPAug, 2021

具身 BERT:一种用于具身、语言引导的视觉任务完成的 Transformer 模型

TL;DREmBERT 是一种基于 transformer 的模型,具有语言指导的目的完成能力。它是第一个能够成功处理 ALFRED 的历史记录、多模态的长时间跨度的 transformer 模型,同时也是第一个在 ALFRED 中使用对象导航目标的模型。