Nov, 2023

评估 GPT-4 在巴西大学入学考试中的视觉能力

TL;DR通过综合文本和视觉元素,对语言模型在入学考试上进行评估的综合框架表明 GPT-4 在处理复杂多学科问题方面具有最先进的能力,但数学问题仍然是这些模型的挑战。