Dec, 2016

通过对抗后向传播实现图像文本多模态表示学习

TL;DR本文介绍了一种新的图像 - 文本多模态表示学习方法,该方法利用对抗学习概念进行多模态学习,不利用图像 - 文本对信息进行学习,只使用类别信息,其多模态特征的分布与利用图像 - 文本对信息进行学习的其他方法相比更为相似,并且具有通用的语义信息。该模型是端到端反向传播的,在其他多模态学习工作中易于扩展。