ICCVJan, 2022

视频识别中压缩序列为一个信息丰富的帧

TL;DR本文提出了一种信息帧综合(IFS)架构,通过三个目标任务和两个正则化器来生成一个可以用于视频分析的综合框架,并用大规模 Kinetics 数据集进行了广泛的实验。与将视频序列映射到单个图像的基线方法相比,IFS 表现出优越的性能。此外,IFS 在基于图像的 2D 网络和基于片段的 3D 网络上表现一致,并以较少的计算成本实现了与最先进方法的相当性能。