Mar, 2024

NPHardEval4V: 多模态大型语言模型的动态推理基准

TL;DR多模大型语言模型的推理能力研究及其在动态基准评估中的影响和不足。