Nov, 2023
程序协助推理器更加明确自己所知
Program-Aided Reasoners (better) Know What They Know
Anubha Kabra, Sanketh Rangreji, Yash Mathur, Aman Madaan, Emmy Liu...
TL;DR本文比较了五个数据集和两个模型类型(LLaMA 模型和 OpenAI 模型)上程序辅助语言模型(PAL)和基于文本的思维链(COT)提示技术的校准情况。结果表明,PAL 在 75% 的情况下能够提供更好的校准性能。我们的分析发现,生成较少多样性的提示风格也具有更好的校准结果,因此我们还尝试使用温度缩放来降低生成的多样性,并发现在某些温度下,PAL 不仅更准确,而且还更具校准性。总体而言,我们证明在大多数情况下,程序辅助的推理者比基于文本的对应者更好地了解自己的知识。