Dec, 2023

DMC4ML: 机器学习的数据移动复杂性

TL;DR该论文通过分析 transformers、spatial convolution 和 FFT 三种机器学习算法,提出了三个创新点。首先,它使用抽象的内存层次结构来衡量内存访问成本,而不是传统的时间或空间复杂度。其次,该分析是渐近的,并确定了内存成本的主要来源。最后,该结果是符号的,可以用于选择算法参数,例如分组查询关注力的组大小,以及任意尺寸和头数的批量卷积的批量大小。