CVPRJun, 2015

使用叙述指令视频进行无监督学习

TL;DR本文提出一种基于非监督学习的方法,通过集合指导语音和视频,可以自动地学习完成某项任务的主要步骤,例如更换汽车轮胎。通过应用两个聚类问题,同时解决文本和视频中的信息,使它们连接在一起,得出在两种情况下都具有一致性的主要步骤。本文提出的方法可以自动地在输入视频中发现和定位处于任务中的主要步骤。作者还采集和注解了一个包含旨在模拟真实场景的任务的挑战数据集。