BriefGPT.xyz
Ask
alpha
关键词
efficient attention mechanisms
搜索结果 - 2
EMNLP
高效 Transformer 知识蒸馏:绩效评估
对高效注意力转换模型进行知识蒸馏的模型压缩评估,并通过新的长上下文命名实体识别数据集 GONERD 验证了高效注意力转换模型在保持原始模型性能的同时降低推理时间的效果。
PDF
7 months ago
通过控制变量实现高效关注
通过控制变量的方法,我们将随机特征关注(RFA)分解成多个控制变量估计器的和,从而揭示了 RFA 和标准 softmax attention 之间的逼近差距。我们开发了一种更灵活的控制变量形式,得到了一种新颖的注意机制,该机制在保持线性复杂
→
PDF
a year ago
Prev
Next