AAAIJan, 2022

使用深度语义聚类进行无监督的时间视频锚点定位

TL;DR本文提出一种无监督学习的方法 Deep Semantic Clustering Network,通过语言语义挖掘、视频语义聚合和前景注意力等步骤,实现对 Temporal video grounding 的定位,取得了竞争性的性能表现。