Oct, 2023

Transformer在思维链条中的表达能力

TL;DR研究表明,通过允许transformer在回答问题之前生成和依赖于中间令牌的序列,可以提高其推理能力,增加中间生成的数量将显著扩展transformer解码器的计算能力,进而使其能够识别所有正则语言,保持上下文敏感语言,并解决多项式时间可解问题。