Feb, 2023

变压器:理论基础和应用

TL;DR该文章主要介绍了 Transformers,这是一种神经网络体系结构,用于解决各种问题,包括自然语言处理、声音、图像、强化学习和其他具有异构输入数据的问题。其独特之处在于其基于自我序列的自我注意力系统,本文介绍了构成此类型网络的数学和算法基础,以及其不同组件和变化的应用。