Jul, 2024

了解你的局限性:大型语言模型中弃权的调查

TL;DR本文解决了大型语言模型(LLMs)在回答时拒绝提供答案的问题,从而减少幻觉风险并提高安全性。提出了一个框架从查询、模型和人类价值观三个角度审视弃权,整理了相关文献,讨论了已有方法的优缺点,并指出未来研究的潜在方向,如如何实现超越具体任务的弃权能力。