BriefGPT.xyz
Jan, 2020
更加注重细节:视频中句子的弱监督时间根据地
Look Closer to Ground Better: Weakly-Supervised Temporal Grounding of Sentence in Video
HTML
PDF
Zhenfang Chen, Lin Ma, Wenhan Luo, Peng Tang, Kwan-Yee K. Wong
TL;DR
本文研究了弱监督下的视频句子时间定位问题,提出了一个两阶段模型,通过多尺度滑动窗口形成时间片段的间隔性建议,和在特征空间进行粗细匹配定位,最终在ActivityNet Captions数据集和Charades-STA数据集上取得良好的表现。
Abstract
In this paper, we study the problem of
weakly-supervised
temporal grounding
of
sentence
in
→