Feb, 2023

自动常识推理基准:一项调查

TL;DR论文概述了 AI commonsense benchmarks 的发展与应用、common sense 的本质及其在 AI 中的作用、构建 commonsense benchmarks 所服务的目标和理想特征。作者分析了现有 benchmark 的常见缺陷,调查了各种构建 commonsense benchmarks 的方法,总结了 139 个 commonsense benchmarks。然而,作者指出现有 benchmark 存在的空缺和 commonsense 推理的方面,并提出了未来的建议。