Apr, 2018

从不完整和异构化数据中学习文本 - 视频嵌入

TL;DR该研究提出了一种 Mixture-of-Embedding-Experts 模型,可以利用来自图像和视频数据集的数据源同时改进文本视频嵌入,解决了训练中缺失输入因素的难题,并在视频检索任务中表现出显著的改进和优越性能。