BriefGPT.xyz
Ask
alpha
关键词
trams
搜索结果 - 1
TRAMS:无需训练的长程语言模型记忆选择
提出了一种称为 TRAining-free Memory Selection (TRAMS) 的插拔式策略,通过一个简单的评价指标选择参与注意力计算的令牌,从而改善长程语言建模的挑战,无需额外训练或添加参数,通过在 word-level b
→
PDF
8 months ago
Prev
Next