Feb, 2024

思考的不确定性:不确定性感知规划增强大型语言模型中的信息搜索

TL;DR通过模拟、激励和奖励机制,引入了一种名为不确定性思考(UoT)的算法来提高大型语言模型在主动寻求信息方面的能力。在医学诊断、故障排除和 '20 个问题 ' 游戏的实验中,UoT 相较于直接提示的方式,在成功完成任务的速度上平均提高了 57.8%,同时也提高了任务完成所需的效率(即问题数量的减少)。