Aug, 2024

在自然语言推理中定义和评估语言模型的决策风险和复合风险

TL;DR本研究针对大型语言模型(LLMs)在推理中的不当信心所带来的风险,提出了决策风险和复合风险的定义以及评估框架。研究表明,该框架能够使模型更自信地处理特定低风险任务,同时有效跳过高风险任务,从而显著提升推理的准确性和安全性。