BriefGPT.xyz
大模型
Ask
alpha
关键词
long range arena
搜索结果 - 2
HGRN2:具有状态扩展的门控线性循环神经网络
HGRN2 通过引入基于外积的状态扩展机制,在不引入额外参数的情况下,显著增加了循环状态大小,提高了语言建模、图像分类和长距离竞技场方面的性能。
PDF
3 months ago
线性动力学嵌入神经网络用于长序列建模
长序列建模中性能和计算效率之间的权衡成为现有模型的瓶颈,本文基于控制理论中具有多输入和多输出的连续状态空间模型(SSMs),提出了一种新型神经网络,称为线性动力学嵌入神经网络(LDNN)。通过对角化和解耦然后快速傅里叶变换(FFT)的两种高
→
PDF
4 months ago
Prev
Next