Aug, 2019
在大型预训练变换器中集成多模态信息
Integrating Multimodal Information in Large Pretrained Transformers
Wasifur Rahman, Md. Kamrul Hasan, Sangwu Lee, Amir Zadeh, Chengfeng Mao...
TL;DR本文提出了一种名为 Multimodal Adaptation Gate (MAG) 的附加组件,该组件可以扩展 BERT 和 XLNet 的语言模态以接受面部表情和语音等多模态信息,在情感分析等任务上具有显著的性能优势。