ICLRJan, 2023

DIFFormer: 由能量受限传播引发的可扩展(图)变压器

TL;DR本文介绍了一种能量受限扩散模型,用于跨数据集批次地学习实例表示,通过相互作用逐渐并入其他实例的信息,以找到几何结构。研究结果表明,该模型可作为一种通用的编码器,在节点分类、图像 / 文本分类、时空动态预测等各种任务中表现出优越性能。