Oct, 2023

ARN:故事类修辞推理的综合框架和数据集

TL;DR通过将认知心理学中的类比推理理论在叙述上进行计算适应,我们提出了类比叙事(ARN)数据集和一个大规模的评估框架,研究了不同抽象程度的类比、不类比之间的匹配。研究结果表明,当较高级别的映射缺乏较低级别的映射时(远类比),大语言模型难以识别;而当所有映射同时存在时(近类比),大语言模型的性能得到改善。我们观察到,在所有的设置中,大语言模型的类比推理能力容易受到与查询叙事形成较低级别映射的近干扰的影响。