Jun, 2024

UpDLRM: 使用真实世界的 PIM 架构加速个性化推荐

TL;DR利用实际世界的处理内存 (PIM) 硬件 UPMEM DPU,提出 UpDLRM,以增加内存带宽并减少推荐延迟。通过利用 DPU 内存的并行特性,可以为嵌入式查找中的大量不规则内存访问提供高聚合带宽,从而在推理时提供巨大潜力来降低延迟。通过研究嵌入式表分区问题,充分利用 DPU 内存带宽,实现良好的工作负载平衡和高效的数据缓存。使用真实世界数据集进行评估,UpDLRM 在 DLRM 中实现了比仅 CPU 和 CPU-GPU 混合对应物更低的推理时间。