BriefGPT.xyz
Ask
alpha
关键词
temporally-aware spatial encoder
搜索结果 - 1
CVPR
流媒体视频模型
提出了一种名为 “Streaming Vision Transformer” 的流式视频架构,利用具有内存功能的时间感知空间编码器产生帧级特征,供基于帧的视频任务使用;然后将帧级特征输入到与任务相关的时间解码器中,获得用于序列化任务的时空特
→
PDF
a year ago
Prev
Next