Nov, 2022

视频识别中的关注更多、关爱更少

TL;DR本研究提出了 Ample and Focal Network (AFNet),通过使用两个分支结构来利用更多的帧数,以实现更准确的动作识别,同时确保计算效率。与现有方法相比,EFNet 在使用更多帧数的同时,计算成本更低。在大量的实验中,本研究表明了 AFNet 的有效性和高效性。