Jun, 2024

分子图转换模型的高效锐度感知极小化优化

TL;DR通过近似梯度和损失景观的限制,GraphSAM 算法减少了 Sharpness-aware minimization(SAM)的训练成本,并提高了图变压器模型的泛化性能。