BriefGPT.xyz
大模型
Ask
alpha
关键词
masking schemes
搜索结果 - 2
ACL
VLM: 任务无关的视频语言模型预训练,用于视频理解
提供了一种简化、任务无关的多模态预训练方法,可以接受视频或文本输入,或两者皆可用于各种端任务。实验结果表明,在多种任务中表现出比以前的方法更强的性能,通常优于任务特定的预训练。
PDF
3 years ago
MM
图像检索的基于选择性深度卷积特征
本文提出了一种新颖的框架用于图像检索,通过采用各种掩码方案从卷积特征中选择代表性的子集来解决爆炸性问题,并采用最新的嵌入和聚合方法进一步提高特征可区分性,从而达到了最先进的检索准确度。
PDF
7 years ago
Prev
Next