BriefGPT.xyz
Ask
alpha
关键词
video transformer model
搜索结果 - 1
视频 Transformer 的时空混合注意力
本研究论文介绍了一种使用 Transformer 进行视频识别的模型,相较于其他视频识别模型,本模型计算效率更高。为实现此目的,本模型对全时空注意力机制进行两种简化处理:(a) 限制时间注意力于局部时间窗口内,(b) 使用高效的时空混合方法
→
PDF
3 years ago
Prev
Next