BriefGPT.xyz
大模型
Ask
alpha
关键词
content-based reasoning
搜索结果 - 1
Mamba:具有选择性状态空间的线性时间序列建模
基于 Transformer 架构的基础模型凭借其核心注意力模块,驱动着深度学习中大部分令人兴奋的应用。我们发现这种模型的一个关键弱点是其无法进行内容导向的推理,并对此进行了改进,通过让结构状态空间模型(SSMs)参数成为输入的函数来解决离
→
PDF
7 months ago
Prev
Next