BriefGPT.xyz
Ask
alpha
关键词
two-stream models
搜索结果 - 4
CVPR
基于 RGB 的时间动作检测的交叉模态分解蒸馏
本文介绍了一种基于交叉模态蒸馏的分解式跨空间学习框架,通过学习 RGB 和运动表征并结合两者来完成动作定位,极大地提高了基于 RGB 的动作检测器的性能,该框架不受骨干网络和检测头的影响。
PDF
a year ago
基于度量的视频动作识别小样本学习
本研究介绍了针对少样本学习的视频动作识别任务,采用双流模型和三种常见的基于度量的算法,通过一组卷积和递归神经网络视频编码器进行训练和评估,证实了双流设置的重要性,并发现原型网络和池化长短期记忆网络嵌入为少样本方法和视频编码器提供了最佳性能。
→
PDF
5 years ago
IJCAI
视频分类的光流特征幻象
本文提出了一种名为 MoNet 的运动幻觉网络,通过从外观特征想象光流特征,而无需依赖光流计算,大幅度提高了视频分类性能,同时能够帮助削减一半的计算和数据存储负担。
PDF
5 years ago
深度表示学习在动作识别方面的启示
通过可视化两流模型学习识别视频中人类动作所获得的深度时空表示,我们揭示了一些关键的观察结果,例如交叉流融合可以让网络学习到真正的时空特征,而不是简单的外观和动作特征,同时我们发现可视化不仅可以揭示学习到的表示,还可以说明系统失效的原因。
PDF
7 years ago
Prev
Next