Mar, 2022

评估计算机常识的理论基础基准

TL;DR本文提出了一个名为 TG-CSR 的具有理论基础的通识常识推理基准,该基准旨在评估通识常识的各种方面,并基于少量的训练和验证示例进行学习。通过初步的测试结果表明,该基准对于设计用于推理性 CSR 问题答案的先进语言表示模型来说是具有挑战性的。