ICLRSep, 2023

Transformer-VQ: 基于向量量化的线性时间 Transformer

TL;DRTransformer-VQ 是一种仅有解码器的 Transformer 模型,通过向量量化的键和新颖的缓存机制实现了线性时间内的高效 softmax 密集自注意力计算。在大规模实验中,Transformer-VQ 在质量方面表现出强大的竞争力,在 Enwik8(0.99 bpb)、PG-19(26.6 ppl)和 ImageNet64(3.16 bpb)上取得了优秀的结果。