Feb, 2017

信息融合的门控多模单元

TL;DR本文介绍了一种基于门控神经网络的多模式学习新模型,称为 Gated Multimodal Unit (GMU) 模型,该模型用于在神经网络结构的内部单元中学习如何将来自不同模式的数据进行组合,并可用于电影类型分类中,通过使用剧情和电影海报的信息,模型在多标签情况下显著提高了单模式方法的性能,并优于其他的融合策略,同时提供了一个新的多模式数据集 MM-IMDb 用于电影类型分类的研究.