Apr, 2024

高性能计算系统上机器学习应用中的 I/O:全方位调查

TL;DR通过对高性能计算系统中机器学习应用的 I/O 进行研究,本文在 2019 年至 2024 年的 6 年时间窗口内,概述了机器学习的常见阶段,评估了可用的分析工具和基准测试,探讨了机器学习训练过程中遇到的 I/O 模式,研究了现代机器学习框架中使用的 I/O 优化方法并提出了未来的研究方向和需要进一步探索的问题。