Feb, 2022

VU-BERT:一个视觉对话的统一框架

TL;DR本文提出了一种名为VU-BERT图文联合嵌入的框架,通过用patch projection获取视觉嵌入来简化模型,从而解决了现有研究中用于建模交互的具有特定模态的模块难以使用的问题,并在可视对话任务上取得了较高的竞争性表现。