May, 2019

多模态话语嵌入的强大而简单的基准线

TL;DR本文提出了两种简单但强大的基线方法来学习多模式言论的嵌入表示。第一种基线方法假设言论被条件因式分解成单模态因子,并表明最优嵌入可以通过单模态特征的加权平均获得。第二种基线方法通过将言论因式分解成单模态、双模态和三模态因子来捕获更丰富的表示。实验显示出在两个任务上的强大性能以及在推理期间相对于神经模型的显着(10倍)加速。