Oct, 2024

大型语言模型中的不确定性估计调查:理论与实践的结合

TL;DR本研究针对大型语言模型(LLMs)推出的一个关键问题——预测中的不确定性估计,指出现有文献多依赖启发式方法,缺乏系统的分类。论文通过整合贝叶斯推断、信息理论和集成策略等理论视角,分类了各种不确定性估计方法,并探讨了将这些方法应用于LLMs时面临的挑战,同时还分析了它们在多种应用中的集成方式,旨在推动LLMs在现实场景中更可靠有效的不确定性估计方法的发展。