可扩展等变学习的 SE (3)- 土狼算子

Jul, 2024

可扩展等变学习的 SE (3)- 土狼算子

SE(3)-Hyena Operator for Scalable Equivariant Learning

Artem Moskalev, Mangal Prakash, Rui Liao, Tommaso Mansi

TL;DR基于 Hyena 操作符的等变长卷积模型 SE (3)-Hyena，在保持旋转和平移等变性的同时，以次二次复杂度捕捉全局几何上下文，处理长序列时比等变自注意力机制更省内存和计算资源。

Abstract

Modeling global geometric context while maintaining equivariance is crucial for accurate predictions in many fields such as biology, chemistry, or vision. Yet, this is challenging due to the computational demands

global geometric context equivariance long-convolutional model se(3)-hyena operator computational resources

发现论文，激发创造

鬣狗等级制度：朝着更大的卷积语言模型

本文介绍了 Hyena，一种亚二次的 attention 替代方法，它通过交错的启发式参数化长卷积和数据控制开关的方式进行构建，能够有效地解决 Transformers 中 quadratic cost 的问题，并且在大规模自然语言处理任务中实现了 Transformer 模型一致的精度，同时减少了 20% 的训练计算资源。

Feb, 2023

SE (3)-Transformers：三维旋转平移等变注意力网络

本文介绍了 SE (3)-Transformer，一种用于 3D 点云和图形的自我注意模块，它在连续 3D 旋转变换下具有等变性。SE (3)-Transformer 利用自我注意的好处来处理点云和图形，同时保证了 SE (3)- 等变性，从而提高了模型的稳健性和预测性能。本文的模型在多个数据集上均取得了竞争性能，超过了一个强的非等变的基准模型和一个等变的模型没有注意力。

Jun, 2020

HyenaPixel：基于卷积的全局图像上下文

使用基于卷积的 Hyena 注意力替代方法，在图像分类中实现竞争力的 ImageNet-1k top-1 准确率，同时超过其他大核网络，并结合注意力进一步提高准确性。

Feb, 2024

用于三维点云分析的等变点网络

本文提出了一个有效的 SE（3）网络，它是针对点云分析领域中 3D 形状对齐任务而设计的，可以利用等变特征来提高性能并解决相对较少探索的旋转等变特征对 3D 形状对齐任务的处理问题。我们采用一个新的框架 SE (3) 可分点卷积来降低计算成本，并在网络中引入一个注意力层来有效地利用等变特征的表达能力。通过广泛的研究和视觉解释，实证结果表明，我们提出的模型在各种基准测试中优于强基线。

Mar, 2021

多维鬣狗在空间归纳偏差中的应用

通过使用基于多个轴的新型 Hyena 层，我们提出了一种不依赖于自注意力机制的高效视觉 Transformer，并且实验证明该方法在多个数据集上提升了各种 Vision Transformer 架构的性能。

Sep, 2023

具图卷积的等变神经运算符学习

我们提出了一种将系数学习方案与残差操作器层结合起来的通用架构，用于在三维欧几里得空间中学习连续函数之间的映射。通过设计，我们的模型可以保证实现 SE (3)- 等变性。从图谱的观点来看，我们的方法可以被解释为在图上（具有无限多个节点的稠密图）上进行卷积，我们将其称为 InfGCN。通过利用输入数据的连续图结构和离散图结构，我们的模型可以有效地捕捉几何信息并保持等变性。通过在大规模电子密度数据集上进行广泛的实验证明，我们的模型明显优于当前最先进的架构。我们还进行了多项消融研究，以证明所提出的架构的有效性。

Nov, 2023

豪笑鬣狗酿酒厂：从卷积中提取紧凑的重现

通过提取低维线性状态空间模型以及改进卷积层的结构，本文实现了每个标记的 O (1) 计算和内存开销，从而降低内存占用并提高生成过程的吞吐量，而无需牺牲质量。

Oct, 2023

具有完整局部参考系的 SE (3) 等变图神经网络

本文提出了一种构建 SE (3) 等变图神经网络的框架，该框架可以在保证性能的前提下实现计算效率的提升，并在牛顿力学建模和平衡分子构型生成两个任务中展示了优异的性能。

Oct, 2021

在位置 - 方向空间中通过权重共享实现快速高效的 SE$(n)$ 等变网络

基于均匀空间理论，我们得出了在灵活的消息传递框架中使用的几何最优边属性，将卷积网络中的权重共享定义为在应该等同处理的点对上共享消息函数的共享点对的等价类，并导出能够唯一标识这些等价类的属性。我们通过在处理 3D 点云时开发了一种高效的等变群卷积网络来应用这一理论。在三个不同的基准测试中，即原子间势能预测、N 体系统轨迹预测和通过等变扩散模型生成分子，我们以准确性和速度方面达到了最先进的结果。

Oct, 2023

HyenaDNA：基于单核苷酸的远距离基因组序列建模

HyenaDNA 是一个在人类参考基因组上进行预训练的基因组基础模型，具有长达 100 万个单核苷酸的上下文长度和单核苷酸层面的全局上下文，以及可用于简单调整以适应新任务而无需更新预训练模型权重的上下文学习能力，并在核苷酸转换器和基因组基准测试中达到了最先进的水平。

Jun, 2023