Aug, 2019

在大型预训练变换器中集成多模态信息

TL;DR本文提出了一种名为 Multimodal Adaptation Gate (MAG) 的附加组件,该组件可以扩展 BERT 和 XLNet 的语言模态以接受面部表情和语音等多模态信息,在情感分析等任务上具有显著的性能优势。