CVPRMar, 2024

增量动作分段的连续时间合成

TL;DR数据回放是一种成功的图像增量学习技术,但在视频领域的应用尚不成熟。本论文首次探索了视频数据回放技术在增量动作分割中的应用,重点关注动作时间建模。我们提出了一种名为 Temporally Coherent Action (TCA) 的模型,通过生成模型来表示动作,而不是存储单个帧。引入了捕捉时间相干性的条件变量,使得我们的模型能够理解动作特征随时间的演化。在 Breakfast 数据集上进行的 10 个任务的增量设置中,我们的方法与基准方法相比,在精度上实现了最多 22% 的显著增长。