Apr, 2025
优化数据分布和内核性能,以高效训练化学基础模型:以MACE为例
Optimizing Data Distribution and Kernel Performance for Efficient
Training of Chemistry Foundation Models: A Case Study with MACE
TL;DR本研究解决了化学基础模型(CFM)在数据分布和模型训练过程中的负载均衡问题,提出了将数据分布视为多目标装箱问题的迭代算法,从而实现高效的数据分配。此外,对MACE模型中的对称张量收缩内核进行优化,显著提高了训练速度。实验结果表明,训练每个周期的执行时间从12分钟缩短至2分钟,提升了效率。