Feb, 2024

LLM 生成代码的质量与信任

TL;DR该论文介绍了一种评估生成模型校准性的框架,并发现大部分生成代码模型在校准性方面表现不佳。通过使用 Platt 缩放等标准方法,可以改善校准性,从而提供更准确的决策支持和为未来研究提供校准方法的框架。