BriefGPT.xyz
Ask
alpha
关键词
alti
搜索结果 - 1
EMNLP
测量 Transformer 中上下文信息的混合
该论文提出了一种名为 ALTI 的方法,通过考虑注意力模块(multi-head attention, residual connection and layer normalization)以及定义一种新的度量方法来测量各层之间的令牌交互
→
PDF
2 years ago
Prev
Next