Jun, 2022

视频模型中的独立帧间关注

TL;DR本文提出一种名为SIFA的新型帧间注意力机制,能够有效地捕捉帧间形变信息,应用于ConvNets和Vision Transformer中成功构建SIFA-Net和SIFA-Transformer,并在多个视频数据集上进行实验,证明了SIFA-Net和SIFA-Transformer的有效性。