Dec, 2020

D2-Net: 通过判别嵌入和去噪激活进行弱监督行动定位

TL;DR本文提出了一种名为D2-Net的弱监督时间动作本地化框架,其尝试使用视频级监督来对动作进行时间定位。其中,我们的创新主要体现在引入了一个新的损失函数,该函数通过联合增强潜在嵌入的可区分性和输出时间类别激活的鲁棒性,从而应对弱监督引起的前景背景噪声。通过综合多个基准测试数据,包括THUMOS14和ActivityNet1.2,我们的D2-Net方法在所有数据集上表现良好,其mAP在IoU = 0.5时可以达到2.3%的提高。