May, 2024

可操控的 Transformer

TL;DR在这项工作中,我们介绍了可转向 Transformer,这是 Vision Transformer 机制的一种扩展,它对特殊欧几里得群 SE (d) 保持等变性。我们提出了一种等变的注意机制,它在可转向卷积提取的特征上运作。在傅里叶空间中操作,我们的网络利用了傅里叶空间的非线性性。我们在二维和三维中的实验证明,将可转向 Transformer 编码器层添加到可转向卷积网络中可以提高性能。