Jun, 2018

顺序关注、推理、重复: 运动物体的生成建模

TL;DR本文介绍了一种基于深度生成模型的可解释视频对象追踪算法 Sequential Attend, Infer, Repeat (SQAIR),它可以对视频中的对象进行可靠的发现和跟踪,并可以生成未来的视频帧,该模型的潜在变量明确地编码了对象的存在、位置和外观,并且具有 AIR 算法(Eslami et. al.,2016)的所有优点,在无监督学习的情况下学习,并且通过利用对象的时间一致性来克服 AIR 算法在检测重叠或部分遮挡对象方面的局限性,该算法还可用于实时行人 CCTV 数据的对象检测,跟踪和生成。