Sep, 2023

HANS,你聪明吗?神经系统的聪明汉斯效应分析

TL;DR我们通过使用四个多选题基准来调查 It-LLMs 对多个探测测试的韧性能力。引入对抗性示例,我们展示了在选择顺序变化时出现的显著性能差距,揭示了选择偏差并讨论了推理能力。通过使用连续思维(CoT)技术,我们引发模型进行推理并减轻偏见,从而获得更强大的模型。