Jul, 2022

Transformer 模型的正式算法

TL;DR本文是一篇数学精确的论文,主要介绍 transformer 算法和结构,如何进行训练及其应用领域,读者需要熟悉基本的机器学习术语和神经网络架构,如 MLP 等。