关键词spatiotemporal feature learning
搜索结果 - 6
- 深度视频表示学习综述
该论文提供了对视频表示学习的综述,对于顺序视觉数据的时空特征学习方法进行分类,并比较它们在视频分析中的优缺点。
- RainAI -- 卫星数据降水即时预测
通过使用 2D U-Net 模型进行空时特征学习,通过重要性采样和数据集准备,以及研究交叉熵损失函数、条件时间领先和上采样方法,提升天气预报准确性。
- ECCV时空自注意力建模与时间补丁位移在动作识别中的应用
本文提出一种 Temporal Patch Shift(TPS)方法,用于在 transformer 模型中对视频进行高效的三维自注意力建模,可插入到现有的二维 transformer 模型中以增强时空特征学习,该方法在计算和内存成本上比现 - ICML空时注意力是否足以理解视频?
该论文提出了一种基于自注意力机制的视频分类方法,名为 TimeSformer,适用于序列级别的视频帧,采用分离式自注意力机制,不仅训练速度比 3D 卷积神经网络更快,而且在多个动作识别数据集上实现了最佳效果,且支持处理长达一分钟的视频.
- CVPR外貌与关系网络用于视频分类
本论文提出了一种新的架构,叫做 Appearance-and-Relation Network(ARTNet),用于以端对端的方式学习视频表示,具有由多个通用构建块构成的 SMART 块,可同时对外观和关系进行建模,以用于行动识别等计算机视 - 使用三维卷积神经网络学习时空特征
通过在大规模监督视频数据集上使用训练的深度三维卷积神经网络(3D ConvNets)提出了一种简单而有效的时空特征学习方法。我们的成果有三个:1)相对于 2D ConvNets,3D ConvNets 更适用于时空特征学习;2)所有层中具有