BriefGPT.xyz
Ask
alpha
关键词
cfmm
搜索结果 - 1
眼见不一定全是实情:多模态大语言模型因果推理能力的基准测试
基于现有多模态大型语言模型 (MLLMs) 在视觉问答评测方面的认知和推理能力,我们提出了一个新的 CFMM(Counterfactual MultiModal)基准测试,以系统评估 MLLMs 的反事实推理能力,发现现有 MLLMs 往往
→
PDF
3 months ago
Prev
Next