ICCVMar, 2021

自监督视频学习的拓展视野

TL;DRBraVe 采用不同的视角和时间窗口对视频进行自我监督学习,利用不同的后骨干网络以实现对视图的增强和制作多种视听模型,成功在 UCF101、HMDB51、Kinetics、ESC-50 以及 AudioSet 视听分类基准测试中取得最先进的结果。