Jan, 2024

在代码分布变动下对大型语言模型的不确定性认知:基准研究

TL;DR大规模语言模型在编程语言分析中被广泛应用以提高人类生产力。本研究通过引入大规模基准数据集,调查了应用概率方法来处理与代码分布变化相关的问题,结果表明这些方法能够提高 CodeLlama 的不确定性感知能力,并增加校准质量和不确定性估计精度。然而,在不同标准(如校准误差与错误分类检测)和效能与效率之间存在不同的性能动态,强调了需根据特定环境进行方法选择的必要性。