BriefGPT.xyz
Ask
alpha
关键词
visio-linguistic compositional reasoning
搜索结果 - 2
CounterCurate:通过反事实的例子增强物理和语义的视觉 - 语言组合推理能力
通过 CounterCurate 框架,综合改善对比式和生成式多模态模型的视觉 - 语言组合推理能力,通过解决忽视物理基础推理(计数和位置理解)和使用高能力文本和图像生成模型进行语义反事实微调的潜力等两个问题来提高推理性能。
PDF
5 months ago
CVPR
Winoground: 探究视觉和语言模型的视觉语言组成性
介绍了一项新的任务和数据集 Winoground,用于评估视觉和语言模型进行视觉 - 语言组成推理的能力,展示了目前最先进的视觉和语言模型在该任务上表现不尽如人意的情况,并探讨如何改进模型的方法。
PDF
2 years ago
Prev
Next