May, 2024

教育计划修复基准测试

TL;DR为了促进竞争方法的公平比较和标准化,该研究提出了一个新颖的教育性程序修复基准,对两个高质量的编程数据集进行整理,引入一种新的评估度量指标 rouge@k 来评估修复质量,并评估了五种最近的模型以建立基础性能。