spatiotemporal feature learning | BriefGPT

关键词spatiotemporal feature learning

搜索结果 - 6

深度视频表示学习综述
该论文提供了对视频表示学习的综述，对于顺序视觉数据的时空特征学习方法进行分类，并比较它们在视频分析中的优缺点。
PDF2 months ago
RainAI -- 卫星数据降水即时预测
通过使用 2D U-Net 模型进行空时特征学习，通过重要性采样和数据集准备，以及研究交叉熵损失函数、条件时间领先和上采样方法，提升天气预报准确性。
PDF7 months ago
ECCV时空自注意力建模与时间补丁位移在动作识别中的应用
本文提出一种 Temporal Patch Shift（TPS）方法，用于在 transformer 模型中对视频进行高效的三维自注意力建模，可插入到现有的二维 transformer 模型中以增强时空特征学习，该方法在计算和内存成本上比现
PDF2 years ago
ICML空时注意力是否足以理解视频？
该论文提出了一种基于自注意力机制的视频分类方法，名为 TimeSformer，适用于序列级别的视频帧，采用分离式自注意力机制，不仅训练速度比 3D 卷积神经网络更快，而且在多个动作识别数据集上实现了最佳效果，且支持处理长达一分钟的视频.
PDF3 years ago
CVPR外貌与关系网络用于视频分类
本论文提出了一种新的架构，叫做 Appearance-and-Relation Network（ARTNet），用于以端对端的方式学习视频表示，具有由多个通用构建块构成的 SMART 块，可同时对外观和关系进行建模，以用于行动识别等计算机视
PDF7 years ago
使用三维卷积神经网络学习时空特征
通过在大规模监督视频数据集上使用训练的深度三维卷积神经网络（3D ConvNets）提出了一种简单而有效的时空特征学习方法。我们的成果有三个：1）相对于 2D ConvNets，3D ConvNets 更适用于时空特征学习；2）所有层中具有
PDF10 years ago