Feb, 2024

Transformer机制在训练人类工作记忆任务时模拟前额-纹状体门控操作

TL;DR通过分析基于Transformer神经网络架构的模型在简单序列建模任务上的训练结果,发现Transformer内部的自注意机制在一定程度上呈现出与输入和输出分离机制相似的特征,暗示了未来关于现代AI架构与人脑模型之间计算上的相似性的研究机会。