Feb, 2023

自动常识推理基准:一项调查

TL;DR论文概述了AI commonsense benchmarks的发展与应用、common sense的本质及其在AI中的作用、构建commonsense benchmarks所服务的目标和理想特征。作者分析了现有benchmark的常见缺陷,调查了各种构建commonsense benchmarks的方法,总结了139个commonsense benchmarks。然而,作者指出现有benchmark存在的空缺和commonsense 推理的方面,并提出了未来的建议。