Feb, 2024

PIDformer: Transformer 遇见控制理论

TL;DR我们提出了一种改进 transformer 架构的方法,通过引入自我注意力作为自主状态空间模型,控制系统对输入的干扰进行反馈控制,提高模型的稳定性和容错能力,从而解决了 softmax transformer 中的秩坍缩问题。我们通过在目标分类、图像分割和语言建模等实际任务中的实验证明了该模型的优势和鲁棒性。