Apr, 2022

CowClip: 在单个 GPU 上将 CTR 预测模型训练时间从 12 小时减少到 10 分钟

TL;DR文章提出了一个适用于点击率预测模型的大批量训练方法,针对批次大小扩展时的参数调整问题,介绍了自适应列裁剪法(CowClip)来调整嵌入层参数,成功将模型的批处理大小扩展到原来的128倍,并在不损失准确度的情况下缩短了训练时间。