Jun, 2023

RRWKV: 捕捉 RWKV 中的长程依赖

TL;DR本文提出了回顾性接收加权键值(RRWKV)架构,通过将回顾能力融入到 RWKV 中,有效地吸收信息,同时保持存储和计算效率,从而解决了 RWKV 架构的局限性,能够更好地捕捉长程依赖。