Oct, 2022

通过成语理解 Transformer 记忆召回

TL;DR本文提供了第一种探测 transformer LMs 中记忆序列召回的方法,并分析了记忆预测是一个两步过程,其存储和检索存储在网络的早期层中,这为理解记忆召回提供了第一步,并为未来的 transformer 记忆研究提供了方法基础。