Jun, 2023

如何跨云和大陆培训深度学习模型?实验研究

TL;DR本篇论文旨在探讨通过使用分布在不同数据中心和云提供商中的 Spot VMs 在全球市场上更加高效地培训深度学习模型的可行性及其与集中式训练的成本和吞吐量的比较,并揭示了通过利用 spot instance 定价来培训模型的一种新的成本高效方法,该方法胜过更集中和更强大的硬件,甚至优于竞争价格和按需云服务。