Sep, 2023

通过动态温度采样来改善代码生成

TL;DR通过分析代码标记的丢失分布,我们发现代码标记可以分为两类:难以预测的具有挑战性的标记和容易推测的自信标记。基于以上发现,我们提出了一种简单而有效的方法:自适应温度采样(AdapT sampling),通过在解码不同的标记时动态调整温度系数。我们将难以预测的标记采样时应用较高的温度,从而使 LLMs 能够探索多样的选择。我们在不同规模的 LLMs 上应用 AdapT 采样,并在两个常用数据集上进行评估,结果表明 AdapT 采样明显优于最先进的解码策略。