BriefGPT.xyz
大模型
Ask
alpha
关键词
hierarchical navigation
搜索结果 - 1
ICLR
Treeformer: 高效注意力计算的密集梯度树
本文提出了一种名为 Treeformer 的新型 transformer 模型,通过采用基于决策树的层次化导航方法,将 attention 计算的检索成本从线性降低为几乎对数级,同时使用 TF-Attention 和 TC-Attentio
→
PDF
2 years ago
Prev
Next