图卷积丰富了 Transformer 中的自注意力

Dec, 2023

图卷积丰富了 Transformer 中的自注意力

Graph Convolutions Enrich the Self-Attention in Transformers!

Jeongwhan Choi, Hyowon Wi, Jayoung Kim, Yehjin Shin, Kookjin Lee...

TL;DR用基于图滤波的自注意力机制 (GFSA) 在 Transformer 模型中解决了过度平滑问题，提高了在计算机视觉、自然语言处理、图形模式分类、语音识别和代码分类等各领域的性能。

Abstract

transformers, renowned for their self-attention mechanism, have achieved state-of-the-art performance across various tasks in natural language processing, computer vision, time-series modeling, etc. However, one

transformers self-attention mechanism oversmoothing problem graph-filter-based self-attention performance improvement

发现论文，激发创造

T-GSA：具有高斯加权自注意力机制的变形金刚网络用于语音增强

本文提出了一种高斯加权自注意力 Transformer 神经网络 (T-GSA)，通过自注意力机制的加权距离缩减，实现了显著的语音增强性能改进，在长程依赖任务中实现了并行化计算。

Oct, 2019

自注意力层

通过对 transformer 中不同标记和 graph neural network 中不同节点在深层的相似性进行分析，我们提出了一个简单的修正项，它可以有效地消除过度平滑问题，在弱监督分割任务上表现优于通常基准方法，并且在非常深的图神经网络架构训练上显著提高了训练效果。

Jun, 2023

自注意力增强的图卷积网络：结构学习和节点嵌入

本研究提出了一种名为 GCN-SA 的新型图学习框架，它具有出色的节点级表示学习的泛化能力，并且通过自注意机制和改进的转换器块实现了对长程依赖关系的捕捉，从而使其能够在具有不同程度同质性的图上进行表示学习。

Mar, 2024

全局自注意力作为图卷积替代方案

该论文提出了一种名为 Edge-augmented Graph Transformer (EGT) 的框架来处理任意形式的结构数据，其中使用全局自我关注作为聚合机制，并通过边缘通道来演化结构信息，从而在图结构数据的学习任务中超越了卷积 / 消息传递图神经网络，并在 OGB-LSC PCQM4Mv2 数据集上实现了量子化学回归任务的最新性能。

Aug, 2021

自注意力图池化

本文提出一种基于自注意力机制的图池化方法，使用图卷积实现自注意力，同时考虑节点特征和图拓扑结构，实验结果表明该方法在基准数据集上具有优异的图分类性能。

Apr, 2019

SignGT: 基于有符号关注机制的图转换器用于图表示学习

提出了一种基于签名注意力的图变换器（SignGT），用于自适应地从图中捕获各种频率信息，并通过引入邻域偏置以保留局部拓扑信息学习信息节点表示。

Oct, 2023

从图的视角重新审视 BERT 中的过度平滑问题

本文针对 Transformer-based models 中存在的过度平滑问题，从图的角度进行分析，发现标准化层在过度平滑问题中发挥了关键作用，提出了一种基于层次融合策略的方法以缓解该问题。

Feb, 2022

图转换器泛化能力的提升方法：关注力机制和位置编码的理论探讨

该研究通过理论探索首次分析了浅层图变换器在半监督节点分类中的应用。它使用了自注意力和位置编码，并描述了实现理想的泛化误差所需的样本复杂度和迭代次数的定量特征。此外，文中还展示了自注意力和位置编码如何通过稀疏化注意力图和在训练过程中促进核心邻域，从而增强了图变换器的特征表示能力。实验证明了我们的理论结果。

Jun, 2024

一种内存高效 Transformer 的分组自注意机制

提出了两个新的模块，Grouped Self-Attention 和 Compressed Cross-Attention，可在小超参数限制下实现序列长度为 $l$ 的 $O (l)$ 的计算空间和时间复杂度，并且可以捕捉局部的同时考虑全局信息，实验表明，预测时间序列数据时，我们提出的模型展示了降低计算复杂度的高效性，且性能可与现有方法相当甚至更好。

Oct, 2022

大型图形表示中的 Transformer 简化与授权

本文旨在提出一个简化的图结构 Transformers 算法架构 (SGFormer)，该架构基于一个简单的 attention 模型，可在处理大规模图结构时实现高效信息传播，同时在节点属性预测基准测试中取得了出色的表现。

Jun, 2023