Apr, 2018
从不完整和异构化数据中学习文本 - 视频嵌入
Learning a Text-Video Embedding from Incomplete and Heterogeneous Data
Antoine Miech, Ivan Laptev, Josef Sivic
TL;DR该研究提出了一种 Mixture-of-Embedding-Experts 模型,可以利用来自图像和视频数据集的数据源同时改进文本视频嵌入,解决了训练中缺失输入因素的难题,并在视频检索任务中表现出显著的改进和优越性能。