May, 2023

关于仅解码变压器语言模型计算能力的研究

TL;DR本文从理论上评估解码器型 Transformer 模型的计算普适性,证明单层单注意头的解码器型 Transformer 架构在合理假定下是图灵完备的,同时揭示词嵌入的稀疏性 / 可压缩性是图灵完备性持有的必要条件。