Oct, 2022

Merlin HugeCTR: GPU 加速的推荐系统训练和推断

TL;DRMerlin HugeCTR 是一种用于 CTR 估算的开源 GPU 加速集成框架,支持训练和推断优化,利用模型并行嵌入和数据并行神经网络进行规模化的模型训练,并使用高性能 GPU 嵌入式缓存和分层存储架构相结合,以实现低延迟的在线推荐任务。支持使用 NVIDIA Triton 服务器框架部署,可大幅减少端到端推荐模型推断的延迟。