Feb, 2024

最新 GPT 模型的人工评估 -- 2024

TL;DR使用 GPT-4 模型改进程序综合,通过与 Huamn Eval 连接的代码库展示了在 Python 代码生成上与先前最先进的解决方案相比具有竞争力的性能,同时促进了多步骤范式综合。