Nov, 2022

GPT-Neo 用于常识推理 —— 理论和实践视角

TL;DR本文评估了 GPT-neo 1.3 亿模型在常识推理任务上的表现,发现模型在某些任务上具有竞争力,但当数据集大小显著较小时表现会很差。研究者还使用可视化和推理测试来证实结果,并通过多种方法进行彻底的健壮性测试。