Dec, 2023

与图像共舞:通过静态动态解缠实现视频浓缩

TL;DR通过对视频进行数据蒸馏,提出了一种方法来解决视频中的时间维度问题,该方法首先将视频转化为静态图像作为静态内存,然后使用可学习的动态内存块补偿动态和运动信息,以在不同规模的视频数据集上实现最先进的表现。