BriefGPT.xyz
大模型
Ask
alpha
关键词
decoupled positional attention
搜索结果 - 1
EMNLP
Transformer 的简单有效位置编码
本文介绍了一种新的机制 ——Decoupled Positional Attention,将位置和段信息编码为 Transformer 模型,提高了训练和推理效率,在 GLUE、XTREME 和 WMT 基准测试中实现了竞争性表现,并进一步
→
PDF
3 years ago
Prev
Next