Mar, 2018

语言指代表达的视频目标分割

TL;DR本文提出一种利用语言描述指定目标对象的视频目标分割方法,通过扩展图像的语言基础模型来保证时空连续的预测,实验结果表明这种基于语言监督的方法在 DAVIS'16 数据集上表现与使用像素级掩模的传统方法相同,在 DAVIS'17 数据集上表现优于使用涂鸦的方法。