Apr, 2024

鹰与雀:基于矩阵值状态和动态循环的 RWKV

TL;DR我们介绍了 Eagle(RWKV-5)和 Finch(RWKV-6)这两种序列模型,它们在 RWKV(RWKV-4)架构上有所改进。我们的架构设计包括多头矩阵值状态和一种动态循环机制,提高了表达能力,同时保持了 RNN 的推理效率特性。