BriefGPT.xyz
Ask
alpha
关键词
dense sampling
搜索结果 - 3
CVPR
SwinBERT:基于稀疏注意力的端到端变压器模型用于视频字幕生成
本文提出了一种基于 SwineBERT 的视频字幕生成模型,该模型通过对稠密采样的视频帧进行变换来进行自适应学习,同时通过自适应学习稀疏注意力掩码来对长序列视频进行建模以实现任务性能提升,在五个电影字幕数据集上取得了显著的性能改进和新的最佳
→
PDF
3 years ago
CVPR
时间查询网络用于细粒度视频理解
本文介绍了一种基于 Temporal Query Network 的时空查询机制,通过稠密采样与随机特征库更新方式实现了对细粒度行为的分类,最终在 FineGym 和 Diving48 的数据集上达到了当前最佳效果。
PDF
3 years ago
ECCV
零样本物体检测
本文提出了一种解决零样本目标检测问题的方法,并通过使用视觉 - 语义嵌入,背景感知方法,以及使用大量类别语义标签的辅助数据来解决仅有少数训练类别的问题。在 MSCOCO 和 VisualGenome 两个标准检测数据集上进行实验,验证了该方
→
PDF
6 years ago
Prev
Next