Apr, 2023

使用数字分解评估 Transformer 语言模型在算术运算上的表现

TL;DR本文研究如何通过分解数字来提高 Transformer 语言模型执行算术运算的准确性,称之为 “Calculon”,并将其与 GPT-3 在加减乘三个运算任务上进行了对比,结果表明在五位数加法任务上,Calculon 的准确率提高了 63%。