Feb, 2024

利用反事实任务评估大型语言模型的类比推理能力

TL;DR研究表明,尽管大型语言模型在类比推理方面表现出色,但它们缺乏人类类比能力的鲁棒性和普遍性。