ICLRJun, 2021

CT-Net: 基于通道张量化的视频分类网络

TL;DR本研究提出 Channel Tensorization Network (CT-Net),通过将输入特征的通道维度视为 K 个子维度的乘积来分解卷积,从而轻量化计算量,有效增强不同通道的特征交互,并逐步扩大 3D receptive field,以提高视频分类准确率。在几个具有挑战性的视频基准中(如 Kinetics-400,Something-Something V1 和 V2)的实验中表明,相较于其他最新的方法,CT-Net 在准确性和效率方面表现更优。