Feb, 2025

MoM:基于混合记忆的线性序列建模

TL;DR该研究解决了线性序列建模方法在记忆状态压缩导致回忆性能不足的问题。通过引入混合记忆架构(MoM),利用多个独立的记忆状态并通过路由网络将输入令牌定向到特定记忆状态,显著提升了记忆容量并减少了记忆干扰。实验结果显示,MoM在回忆密集型任务上表现优异,超越了现有线性序列建模技术,甚至与Transformer模型的性能相媲美。