Feb, 2024

在混乱世界中观察物体:基于视频中的运动的计算物体特征

TL;DR通过计算方法,我们展示了利用运动线索和时空注意力来推断客观性而不需要对象模型的能力,并展示了如何在混乱的场景中稳健地感知个别被关注的对象,甚至在模糊和相机抖动的情况下。我们展示了数据多样性和扩增的作用,以最小化偏差并便于应用于真实视频,并描述了如何进一步提升这种计算对象性能力,从而构建一个稳健的模块化视频对象感知框架。