May, 2024

避免使用 HiPPOs 的长记忆状态空间模型之希望

TL;DR通过使用 Hankel 算子理论,我们开发了一种名为 HOPE 的新的 LTI 系统参数化方案,使得状态空间模型能够进行随机初始化、提高训练稳定性,并具有非衰减的记忆能力,相比传统的模型,参数更少,并在长序列任务中表现出更好的性能,同时我们通过应用序贯 CIFAR-10 任务验证了我们模型的长时记忆能力。