Apr, 2024

HGRN2:具有状态扩展的门控线性循环神经网络

TL;DRHGRN2 通过引入基于外积的状态扩展机制,在不引入额外参数的情况下,显著增加了循环状态大小,提高了语言建模、图像分类和长距离竞技场方面的性能。