May, 2024

AutoCoder:使用 AIEV-Instruct 增强代码大型语言模型

TL;DRAutoCoder 是第一个在 Human Eval 基准测试的 pass@1 上超过 GPT-4 Turbo(2024 年 4 月)和 GPT-4o 的大型语言模型(90.9% 对 90.2%)。此外,与 GPT-4 Turbo 和 GPT-4o 相比,AutoCoder 提供了更多功能的代码解释器,其解释器可以安装外部包而不仅限于内置包。AutoCoder 的训练数据是通过将代理交互和外部代码执行验证相结合的系统创建的多轮对话数据集,我们称之为 AIEV-Instruct。与以前的大规模代码数据集生成方法相比,AIEV-Instruct 减少对专有大模型的依赖,并提供经过执行验证的代码数据集。