Aug, 2022

面向大型推荐系统嵌入的频率感知软件缓存

TL;DR本文提出了一种基于 GPU 的软件缓存方法来动态管理 DLRM 的 embedding table,通过利用目标数据集 id 的频率统计信息,在 GPU 和 CPU 内存空间之间进行管理,以此来使得在 GPU 上训练 DLRM 更为实用。同时,该方法也支持多 GPU 并行训练,通过实验证明,只在 GPU 上保留 1.5% 的 embedding 参数就能保障训练速度。