Mar, 2024

分立多塔:拓扑感知建模技术用于高效大规模推荐

TL;DR研究了深度学习推荐模型的平面结构、常见的分布式训练范式和层次化数据中心拓扑之间的不匹配性,提出了分离式多塔(DMT)模型技术,包括保持语义的塔变换(SPTT)、附加在每个塔上的塔模块(TM)以减少模型复杂性和通信量以及可系统创建带有有意义特征交互且负载平衡分配以保持模型质量和训练吞吐量的塔分区器(TP)。