BriefGPT.xyz
大模型
Ask
alpha
关键词
position encoding
搜索结果 - 23
RoFormer: 带旋转位置嵌入的增强 Transformer
本篇论文研究了在语言模型中如何整合位置信息,并提出了一种名为 RoPE 的方法,它可以将位置信息编码为旋转矩阵,并同时将显式的相对位置依赖性结合到自注意力公式中。实验结果表明,RoPE 使 transformer 在处理长文本分类问题时表现
→
PDF
3 years ago
ACL
跨语言位置表示的自注意力
本文使用跨语言位置表示法,将自注意力网络中的位置编码扩展为双语感知潜在结构,利用括号转换语法(BTG)基于重排序信息,以鼓励自注意力网络学习双语对角线对齐,并通过 WMT'14 英语⇒德语,WAT'17 日语⇒英语,WMT'17 中英互译任
→
PDF
4 years ago
使用连续动态模型为 Transformer 学习位置编码
提出了一种新的位置信息编码方法,使用神经常微分方法对非循环模型(如 Transformer)进行编码,并证明在翻译和理解任务中,该编码方法与已有编码方法相比具有更好的性能。
PDF
4 years ago
Prev
Next