Jan, 2024

ConTextual: 大型多模态模型中的上下文敏感的文本丰富视觉推理评估

TL;DRAI 研究纸提出了 ConTextual,它是一个新颖的基准测试,旨在评估 LMM 在上下文敏感的文本丰富的视觉推理方面的能力,发现最佳表现的 LMM 与人类能力存在 30.8%的性能差距,表明上下文敏感的文本丰富的视觉推理仍有改进空间。