Jan, 2025
测试时间回归:设计具有联想记忆的序列模型的统一框架
Test-time regression: a unifying framework for designing sequence models
with associative memory
TL;DR本研究针对序列建模领域缺乏统一框架的问题,提出了一个新的统一框架,该框架强调有效的序列模型必须具备联想回忆能力。通过将输入令牌的记忆与测试时间回归等同起来,研究揭示了多种现代模型的设计选择,并提供了理论基础,促进了更强大且具有原则性的序列模型的发展。