Mar, 2020

使用 PIC 识别长距离活动的置换不变卷积

TL;DR介绍了一种新的神经网络层 ——Permutation Invariant Convolution(PIC),它具有三种可取的属性:在其感受野内部特征的时间排列不变,各个区域之间存在本地连接,使用共享权重,这使得它更能够检测噪声较大的视频中的最有鉴别性的视觉证据,并且该神经网络层能够有效地识别 Charades,Breakfast 和 MultiThumos 等长时间的活动。