Sep, 2023

大型语言模型中的自信 - 能力差距:一项认知研究

TL;DR研究通过对大型语言模型(LLMs)的认知能力和置信度动态的深入了解,揭示了模型中展现高置信度但回答错误的情况,类似于人类心理学中的邓宁 - 克鲁格效应,以及低置信度但回答正确的情况,展示了潜在的低估偏差,强调了对这些语言模型认知过程的深入研究的必要性,以进一步拓展其功能和应用领域。