关键词distributed training system
搜索结果 - 3
- SSFL: 通过个性化自监督解决联合学习中的标签不足问题
本文提出自监督联邦学习框架(SSFL),包括标签不足、数据异构性等挑战,并提出一系列算法,如 Per-SSFL、FedAvg 和 SimSiam 等。作者还开发了一个分布式训练系统和相关评估协议,发现监督和非监督学习之间的性能差距小。
- FastMoE: 快速混合专家训练系统
本文提出了基于 PyTorch 的 FastMoE 分布式混合专家 (Mixture-of-Expert) 训练系统,支持多 GPU 节点上放置不同的专家,通过高效的加速技术实现高速训练,并提供了灵活的模型设计和适应性,适用于 Transf - 大词汇量网络高效分布式 Word2vec 训练系统
本文介绍了一种基于分布式并行训练的新型 Word2vec 算法,可以有效训练具有数亿个单词的大词汇量语料库的词向量表示,而不需要大量数据传输或单个服务器的存储。经实验证明,在 Gemini 广告投放平台实践中取得了显著的业务贡献。