Sep, 2016

使用自然语言的语言 - 视觉嵌入学习以理解电影

TL;DR本文研究了三种不同的联合语言 - 视觉神经网络模型,使用 LSMDC16 电影数据集评估模型在自然语言图像 / 视频注释和检索任务中的性能,并在标准排名和多项选择测试中取得优异的结果。