Jun, 2024

奥林匹克竞技场奖牌排名:迄今最聪明的人工智能是谁?

TL;DR谁是迄今为止最智能的人工智能模型?我们使用奥林匹克竞技场(一个超智能人工智能的奥林匹克级多学科多模式基准)进行评估,并提出使用奥林匹克奖牌榜来排名人工智能模型。实证结果表明:Claude-3.5-Sonnet 在各个学科具有竞争力的综合表现优于 GPT-4o,超过 GPT-4o 在物理、化学和生物学等学科。Gemini-1.5-Pro 和 GPT-4V 排名次于 GPT-4o 和 Claude-3.5-Sonnet,但它们之间存在明显的性能差距。开源社区的人工智能模型性能明显落后于专有模型。这些模型在这个基准上的表现不尽人意,表明我们在实现超智能之前还有很长的路要走。我们致力于持续追踪和评估最新强大模型在这个基准上的表现。