MMSep, 2023

大规模基于内容的视频检索中的片段相似性和对齐学习

TL;DR本文提出了一种用于大规模视频检索的片段相似度与对齐网络 (SSAN),包含了两个新的视频检索模块:高效的自监督关键帧提取 (SKE) 模块和鲁棒的相似性模式检测 (SPD) 模块,通过联合训练实现了端到端的改进,在节省存储和计算成本的同时提高了对齐精度。