BriefGPT.xyz
Ask
alpha
关键词
vtn
搜索结果 - 1
视频变形网络
本文提出了一种基于 Transformer 的视频识别框架 VTN,它相比于传统的 3D ConvNets,通过整个视频序列的注意力机制实现动作分类,并在训练和推断时分别快 16.1 倍和 5.1 倍,同时在 Kinetics-400 数据
→
PDF
3 years ago
Prev
Next