BriefGPT.xyz
Ask
alpha
关键词
deep video models
搜索结果 - 3
TDViT:用于密集视频任务的时序扩张视频变换器
我们提出了一种时态扩张视频变换器 (Temporal Dilated Video Transformer, TDViT),通过使用层次化的时态扩张变换器块 (Temporal Dilated Transformer Blocks, TDTB
→
PDF
5 months ago
ChatVideo: 基于 Tracklet 的多模式通用视频理解系统
本文提出了一种基于轨迹为中心的多模态视频理解原型系统,使用各种视频基础模型(ViFMs)注释其特性,存储在数据库中,并通过数据库管理器与用户交互,以解决各种视频相关问题。
PDF
a year ago
CVPR
一种用于高效训练视频模型的多重网格方法
通过使用多重网格方法和变量小批量形状,以在保持准确性的同时加速视频模型的训练速度,我们提出了一种通用和强健的网格时间表,该时间表可用于不同的模型,数据集和训练设置。
PDF
5 years ago
Prev
Next