BriefGPT.xyz
Ask
alpha
关键词
generative settings
搜索结果 - 2
LLM 生成代码的质量与信任
该论文介绍了一种评估生成模型校准性的框架,并发现大部分生成代码模型在校准性方面表现不佳。通过使用 Platt 缩放等标准方法,可以改善校准性,从而提供更准确的决策支持和为未来研究提供校准方法的框架。
PDF
5 months ago
Donkii:指导调校数据集中的注释错误检测方法能否发现错误?
在这项研究中,我们提出了一个新的 AED 基准测试:Donkii,它包含了三个经过专家和半自动方法注释的指导调整数据集。我们发现这三个数据集中包含明显的错误,有时直接传播到指导调整的 LLMs 中。我们提出了四个适用于生成设置的 AED 基
→
PDF
10 months ago
Prev
Next