Aug, 2019

ViSiL: 细粒度时空视频相似性学习

TL;DR本文介绍了 ViSiL,一种视频相似性学习架构,它考虑了视频对之间的细粒度时空关系,包括了相似性评估之前的整个帧或整个视频的向量描述。通过卷积神经网络,我们从提炼的帧间相似性矩阵中计算视频间相似度,以同时考虑帧内和帧间的相似性。我们的方法避免了在帧之间的相似度计算之前进行特征聚合。我们使用三元组损失方案训练提出的网络,并在五个公共基准数据集上评估它,其中涵盖了四种不同的视频检索问题,结果表明,我们的方法比现有技术取得了显着的进步。ViSiL 的实现公开可用。