Jul, 2023

线性递推跟随非线性投影的普适性

TL;DR使用基于循环线性层(包括 S4、S5 和 LRU),与位置逐层多层感知器(MLPs)交错的序列模型家族可以有效逼近任何足够规则的非线性序列映射,其中循环层被视为能够将输入序列信息忠实地存储在内部状态中,并在高度表达的 MLP 进行处理之前。