Sep, 2024

评估人类与图像模型中的多视角对象一致性

TL;DR本研究解决了人类观察者与视觉模型在3D形状推理任务中的对齐问题。通过借鉴认知科学的实验设计,构建了超过2000个独特的图像集,并收集了来自500多名参与者的35K试验行为数据,结果显示人类在此任务中的表现显著优于所有视觉模型。这一发现强调了人类在应对复杂试验时的独特处理能力,潜在影响深远。