Apr, 2023

GPT-2如何计算大于:对预先训练的语言模型中的数学能力进行解释

TL;DR该研究使用机械解释技术来探讨预训练语言模型的数学能力,以GPT-2小型版本为例,发现它具有限制的数学能力,可通过电路进行解释,最终证明该电路可推广至其他任务。