BriefGPT.xyz
Ask
alpha
关键词
pretrained vision and language models
搜索结果 - 2
改进开放词汇目标检测的伪标签
通过在线自训练和分割融合头以减少预训练视觉语言模型生成的噪声伪标签并提高开放词汇目标检测性能。
PDF
a year ago
MM
超越言语:测试预训练 V&L 模型在计数任务中的跨模态能力
本研究探讨了预训练视觉和语言模型在两个需要多模态集成的任务中的推理能力:(1)区分正确的图像 - 句子对与不正确的对,以及(2)计算图像中的实体。结果显示,预训练的 V&L 模型非常擅长解决任务(1),但无法充分解决任务(2),即计数探针,
→
PDF
4 years ago
Prev
Next