May, 2024

高效多维度顺序建模:LightNet 的一次高效扫描

TL;DR通过识别多维数据模型中的效率问题,本文提出了一种高效的替代性线性回归方法以解决此问题,并基于这种新的回归方法开发了名为 LightNet 的高效多维顺序建模框架。此外,我们提出了两种新的多维线性相对位置编码方法(MD-TPE 和 MD-LRPE),以增强模型在多维场景中识别位置信息的能力。通过包括图像分类、图像生成、双向语言建模和自回归语言建模在内的各种任务的实证评估,我们展示了 LightNet 的有效性,表明其作为多维顺序建模的一种多功能高效解决方案的潜力。