关键词vision-and-language models
搜索结果 - 23
  • SUGARCREPE++ 数据集:视觉语言模型对语义和词汇变化的敏感性
    PDF17 days ago
  • HaLo-NeRF:学习几何引导的语义,探索无约束照片集合
    PDF5 months ago
  • 通过自洽解释改进的视觉对准
    PDF7 months ago
  • 大规模视觉语言模型学习用于高效和高性能的部分相关视频检索的超级图像
    PDF7 months ago
  • 从视觉语言模型中去除不安全内容以用于文本到图像检索和生成
    PDF7 months ago
  • 视听语言模型中的声音象征:Kiki 还是 Bouba?
    PDF8 months ago
  • Babel-ImageNet:大规模多语言视觉语言表示的评估
    PDFa year ago
  • 模态转移中的杠杆点:比较仅语言和多模态词表示
    PDFa year ago
  • CVPR未经筛选的图像 - 文本数据集:揭示人口特征偏见
    PDFa year ago
  • 安卓能否笑对电子羊? - 源自《纽约客》漫画比赛的幽默「理解」基准
    PDF2 years ago
  • PreSTU:场景文本理解的预训练
    PDF2 years ago
  • 学得越多未必越好:视觉与语言任务中的知识可迁移性
    PDF2 years ago
  • WinoGAViL:用于挑战视觉语言模型的游戏化联想基准测试
    PDF2 years ago
  • 重新思考视觉问答中的评估实践:针对分布外泛化的案例研究
    PDF2 years ago
  • ACL视觉空间推理
    PDF2 years ago
  • ACL从上下文描述中检索图像
    PDF2 years ago
  • ACL面向视觉及语言推理的语义分布式鲁棒优化
    PDF3 years ago
  • MMMARMOT:一个用于构建视觉 - 语言任务的多模态表征的深度学习框架
    PDF3 years ago
  • EMNLP视觉语言预训练是否提高了词汇连接能力?
    PDF3 years ago
  • CLIP 能为视觉语言任务带来多大的效益?
    PDF3 years ago
Prev