May, 2025

YABLoCo:另一个长上下文代码生成基准

TL;DR本研究针对现有基准中对小型和中型上下文窗口的局限性,提出了长上下文代码生成基准YABLoCo。该基准包括来自四个大型存储库的215个函数的测试集,涵盖了C和C++语言,以支持在大规模代码库中的函数体生成。研究的关键发现是,该基准能够有效评估大规模代码生成的潜力,并提供可扩展的评估管道和可视化分析工具。