Nov, 2021

展示计算过程:中间计算与语言模型的草稿本

TL;DR利用逐步计算的方法,通过训练变换器模型在少量数据中输出中间运算结果到 “scratchpad”,为多步计算任务赋能,从而显著提高预训练语言模型处理复杂计算的能力。