May, 2025

重新思考大型语言模型在代码生成中的重复问题

TL;DR本研究解决了代码生成中存在的结构性重复问题,这是之前研究主要集中于内容重复之外的更广泛且具有挑战性的难题。提出了一种名为RPG的高效解码方法,通过利用语法规则识别重复问题,并逐步降低导致重复的关键令牌的概率,显著减少生成代码中的重复现象。实验结果表明,RPG在新构建的数据集CodeRepetEval及其它基准测试中明显优于现有方法,提升了生成代码的质量。