Sep, 2016

使用自然语言的语言-视觉嵌入学习以理解电影

TL;DR本文研究了三种不同的联合语言-视觉神经网络模型,使用LSMDC16电影数据集评估模型在自然语言图像/视频注释和检索任务中的性能,并在标准排名和多项选择测试中取得优异的结果。