Jan, 2024

依赖不可靠之处:语言模型不愿表达不确定性的影响

TL;DRAI 与人类交互时,自然语言作为默示接口,需要全面地传达语言模型关于回复的不确定性。研究发现,现有的语言模型在回答问题时无法表达不确定性,导致高错误率。人类在实验中过分依赖于语言模型生成的回复,而且存在对不确定性回复的偏见。因此,该研究提出设计建议和缓解策略,以应对人类与语言模型互动中的新一套安全危害。