Jun, 2024

VersiCode: 面向可版本控制代码生成功能

TL;DR本研究通过引入 VersiCode 数据集和两个专门的评估任务 (VSCC 和 VACE),对大型语言模型在生成特定库版本可验证代码方面的能力进行综合实验和性能评估,揭示了即使是最先进的大型语言模型在生成版本正确代码方面也存在困难,为进一步研究这一重要领域的能力和限制提供新的视角和资源。