ICLROct, 2020

从人类互动中学习视觉表达:肌肉给你怎样启示?

TL;DR本文研究利用人类交互和注意力提示进行编码样本集,以监督方式提高视觉数据的表征能力,在场景分类(语义)、动作识别(时间)、深度估计(几何学)、动态预测(物理学)和可行走表面(可承受性)等目标任务中都优于最新的视觉学习方法 MoCo (He et al.,2020)。