BriefGPT.xyz
Feb, 2024
PIDformer: Transformer遇见控制理论
PIDformer: Transformer Meets Control Theory
HTML
PDF
Tam Nguyen, César A. Uribe, Tan M. Nguyen, Richard G. Baraniuk
TL;DR
我们提出了一种改进transformer架构的方法,通过引入自我注意力作为自主状态空间模型,控制系统对输入的干扰进行反馈控制,提高模型的稳定性和容错能力,从而解决了softmax transformer中的秩坍缩问题。我们通过在目标分类、图像分割和语言建模等实际任务中的实验证明了该模型的优势和鲁棒性。
Abstract
In this work, we address two main shortcomings of
transformer architectures
:
input corruption
and
rank collapse
in their output representa
→