BriefGPT.xyz
Ask
alpha
关键词
winoground dataset
搜索结果 - 2
EMNLP
Winoground 的困难在哪里?调查视觉语言组合的失败
通过一系列实验和数据分析,发现视觉和语言模型中融合文字和视觉表示的挑战可能不在于组合性语言理解,而在于其他能力,如常识推理、低分辨率图像中小物体的定位等,并提出数据扩充等解决方案。
PDF
2 years ago
CVPR
Winoground: 探究视觉和语言模型的视觉语言组成性
介绍了一项新的任务和数据集 Winoground,用于评估视觉和语言模型进行视觉 - 语言组成推理的能力,展示了目前最先进的视觉和语言模型在该任务上表现不尽如人意的情况,并探讨如何改进模型的方法。
PDF
2 years ago
Prev
Next