Jun, 2023

使用 NeuBAROCO 评估大型语言模型的三段论推理能力和类人偏见

TL;DR本文研究当前的大型语言模型是否存在逻辑推理的偏见,探讨三种主要偏见类型,并介绍一种心理实验数据集 NeuBAROCO。通过分析数据集,发现当前的大型语言模型在涉及到这三种类型偏见的问题上表现欠佳。