Sep, 2023

基于LLM的代码生成中的偏见评估与缓解

TL;DR基于最新的大型语言模型 (LLMs) ,本研究提出了一个面向代码生成任务的新型偏差评估框架,并对九种最先进的 LLM-based 代码生成模型进行了广泛评估。研究发现,我们评估的代码生成模型中有 31.45% 到 79.93% 的代码函数存在偏差,其中 9.68% 到 37.37% 的代码函数受到偏差的影响,这意味着不仅代码生成模型存在偏差,而且在某些情况下,偏差直接影响生成代码的功能,存在无意和可能有害的软件行为风险。为了减轻代码生成模型的偏差,我们提出了三种缓解策略,可以将偏差代码比例降低到非常低的水平,即 0.4% 到 4.57%。