Jul, 2024

GraCoRe:大型语言模型中的图推理与复杂推理基准测试

TL;DR本文介绍了GraCoRe,这是一个用于系统评估LLMs的图形理解和推理能力的基准测试,它使用三层分层分类法对纯图形和异构图形进行测试,并通过19个任务对10个不同能力进行测试,研究发现语义增强提高了推理性能,节点排序影响任务成功,处理更长的文本并不一定提高图形理解或推理能力。