Mar, 2023

评估 GPT-3.5 和 GPT-4 模型在巴西大学入学考试中的表现

TL;DR本研究通过分析 GPT-3.5 和 GPT-4 对 Exame Nacional do Ensino Médio 的表现以及不同提示策略的测试,旨在探讨语言模型在解决跨学科知识问题的高风险选择题方面的能力。 2022 年版的 GPT-4 with CoT 模型表现最佳,精度达到了 87%。