BriefGPT.xyz
Ask
alpha
关键词
multiscale feature representation
搜索结果 - 1
ECCV
ActionFormer:使用 Transformers 定位行为片段
ActionFormer 是一种基于 Transformer 网络的模型,采用了多尺度特征表示和本地自我注意力机制来识别视频中的动作。它在 THUMOS14 上取得了 71.0% mAP,在 ActivityNet 1.3 和 EPIC-K
→
PDF
2 years ago
Prev
Next