Jun, 2024

长代码竞技场:长上下文代码模型的一组基准

TL;DR通过引入 Long Code Arena 作为一套六个代码处理任务的基准,我们旨在填补超出单个上下文文件的代码处理基准的空白。这些任务涵盖了代码处理的不同方面:基于库的代码生成、CI 构建修复、项目级代码补全、提交消息生成、错误定位和模块摘要。