Apr, 2024

BIRD:大型语言模型的可信贝叶斯推理框架

TL;DR本文提出了一个名为 BIRD 的贝叶斯推理框架,该框架针对大型语言模型提供了可控和可解释的概率估计,通过加入反推因素、LLM 蕴含和可学习的推导贝叶斯建模。实验表明,使用开源的 Llama 模型,BIRD 的概率估计与人类判断的一致率达到了 65%,比最先进的 GPT-4 提高了 35%。同时,我们还展示了 BIRD 可以直接用于许多真实世界应用的可靠决策。