BriefGPT.xyz
Ask
alpha
关键词
spatio-temporal understanding
搜索结果 - 1
CAST: 视频动作识别中的时空交叉注意力
我们提出了一种新的双流架构,称为 Cross-Attention in Space and Time (CAST),它使用 RGB 输入实现了对视频的平衡的时空理解。我们的提出的瓶颈交叉注意机制使得空间和时间专家模型能够交换信息并进行协同预
→
PDF
7 months ago
Prev
Next