BriefGPT.xyz
Ask
alpha
关键词
video architecture
搜索结果 - 3
MM
DSANet:视频层面表征学习的动态片段聚合网络
本文介绍了一种新颖的动态分段聚合(DSA)模块,该模块通过可调式地减少卷积操作来聚合相邻片段的长时程信息,结合 TSM、I3D 等开箱即用的基于剪辑的模型,提供了一种高效且具有优越性能的视频识别 DSANet 架构。
PDF
3 years ago
CVPR
TDN:高效行为识别的时序差分网络
本文提出了一种新的视觉结构,称为 Temporal Difference Network (TDN),其核心是通过一个高效的 Temporal Difference Module (TDM) 来捕获多尺度信息,以提高动作识别的效率。在 So
→
PDF
4 years ago
行动识别的未来何去何从?一种新模型及动力学数据集
本研究基于 Kinetics 数据集重新评估最先进的体系结构,并引入一种新的双流膨胀 3D ConvNet(I3D),该 ConvNet 可以在视频中学习无缝的时空特征提取器,利用成功的 ImageNet 架构设计及其参数,经过在 Kine
→
PDF
7 years ago
Prev
Next