EMNLPMar, 2022

变压器前馈层通过在词汇空间中促进概念来建立预测

TL;DR通过反向工程变压器模型中的前馈神经网络层的运算过程,分析其词汇空间中的更新,控制预测结果,提高计算效率。