Jun, 2023

RepoBench:评估代码自动完成系统的存储库水平性能

TL;DR该研究介绍一种名为 RepoBench 的新基准,旨在评估特定于存储库的代码自动完成系统,该基准包含三个相互关联的评估任务:RepoBench-R(检索),RepoBench-C(代码完成)和 RepoBench-P(管道),每个任务分别衡量系统从其他文件中检索最相关的代码片段的能力作为跨文件上下文,使用跨文件和文件内上下文预测代码的下一行以及处理需要检索和下一行预测组合的复杂任务。