Oct, 2023

通过近似对角化为长序列的状态空间模型提高鲁棒性

TL;DR在这篇论文中,我们提出了一个用于解决机器学习中的病态对角化问题的通用、稳定的 “扰动 - 然后对角化” (PTD) 方法,并基于此方法引入了 S4-PTD 和 S5-PTD 模型。通过对不同初始化方案的传递函数进行理论分析,我们证明了 S4-PTD/S5-PTD 初始化可以强大地收敛于 HiPPO 框架,而 S4D/S5 初始化只能实现弱收敛。因此,我们的新模型对傅里叶模式噪声扰动输入表现出了鲁棒性,这是 S4D/S5 模型所无法达到的重要特性。此外,我们的 S5-PTD 模型在 Long-Range Arena 基准上平均达到 87.6% 的准确率,证明了 PTD 方法在提升深度学习模型的准确性方面起到了积极作用。