Jun, 2024

评估大型语言模型在理解基数方向上的能力

TL;DR探讨大型语言模型在基于基数方向的推理能力方面的研究,通过创建两个数据集,发现尽管在简单数据集中大型语言模型表现良好,但在更复杂的数据集中,即使温度设置为零,没有任何大型语言模型能够可靠地确定正确的基数方向。