BriefGPT.xyz
Ask
alpha
关键词
visual words
搜索结果 - 3
CVPR
通过预测视觉单词包学习表征
本文提出了一种基于视觉词汇的自监督学习方法,通过将图像特征映射量化为视觉词汇,实现了对图像的分离表示,通过 Bag-of-Words 表示学习有用的下游图像理解特征,与类似自然语言领域的方法相比,该方法在目标检测和分类上表现出更好的迁移能力
→
PDF
4 years ago
AAAI
非自回归式的粗到细视频字幕
本文提出了一种非自回归解码的模型,使用基于双向自注意力的语言模型来加速推理,生成视频字幕的过程分为两个阶段,通过迭代的修改,得到高质量的细致视频描述,大量实验表明该方法达到了最先进的性能,并获得了高推理效率。
PDF
5 years ago
基于元学习的深度视觉词语快速视频对象分割
通过使用聚类,元学习和嵌入式空间中的视觉单词等技术,我们开发了一种快速,因果算法,可在单个前向传递中分割可变数量的对象,并在四个视频分割数据集上实现了最新的速度 / 精度折衷,在不需要调优,附加输入或后处理的情况下。
PDF
6 years ago
Prev
Next