May, 2024

从泛化分析到状态空间模型的优化设计

TL;DR本文研究了状态空间模型(SSM)的普适性,并提出基于普适性结果改进训练算法的方法。具体地,我们给出了一种依赖数据的 SSM 普适性界限,展示了 SSM 参数与训练序列的时间依赖性之间的相互作用。基于该普适性界限,我们(1)建立了一个基于提出的普适性度量的模型初始化缩放规则,显著提高了 SSM 对序列数据中不同时间模式的输出值尺度的稳健性;(2)引入了一种新的正则化方法来提高 SSM 的普适性性能。通过数值实验验证了我们的结果。