Feb, 2024

SEED: 用于代码生成的样本高效适应性定制大型语言模型

TL;DR提出一种名为 SEED 的新型适应方法,利用 LLMs 产生的错误作为学习机会,通过错误修订来克服自身的缺点,从而实现高效学习。实验证明,SEED 相比传统的微调方法在更少的训练样本上实现了更优异的性能,Pass@1 上相对提升了 27.2%-325.0%。同时验证了 Self-revise 的有效性,通过生成更高效的修订代码优化模型,相比于数据集中的代码样本,SEED 在各种 LLMs 上一致显示出强大的性能。