BriefGPT.xyz
大模型
Ask
alpha
关键词
positional encodings
搜索结果 - 22
关于 Transformer 的计算能力及其对序列建模的启示
这篇论文研究了变形金刚网络的计算能力与图灵完备性,得出了只有通过位置掩蔽而没有位置编码的变形金刚同样具有图灵完备性,而某些残差连接是必需的结论,并通过机器翻译和合成任务的实验说明了结果的实际应用。
PDF
4 years ago
定位感知的自注意力与相对位置编码在槽填充中的应用
本文提出如何在关系抽取任务中使用自注意力和相对位置编码。使用一个位置感知的注意力层,利用相对位置编码使每个单词考虑其左右上下文,仅使用注意力机制,在 TACRED 数据集上表现显著提升。
PDF
6 years ago
Prev
Next