Mar, 2024

API 已足够:大型语言模型的无需访问逻辑函数的符合预测

TL;DR本研究旨在解决大型语言模型中无法访问 logits 的不确定性量化的普遍挑战。我们提出了一种面向 API-only 语言模型的新型 CP 方法,通过同时利用粗粒度(如样本频率)和细粒度(如语义相似性)的不确定性概念来构建不确定度量,实现了更好的预测性能。实验证明,我们的方法在封闭式和开放式问答任务中大多能够胜过基于 logits 的 CP 对照组。