Sep, 2023

用于粒子流重建的可扩展神经网络模型与万亿级数据集

TL;DR研究了可扩展的机器学习模型,用于基于高粒度探测器模拟的高能电子 - 正电子碰撞的完全事件重建。比较了图神经网络和基于核的变压器,并证明两者在实现逼真的粒子流重建时,同时避免了二次内存分配和计算成本。展示了在超级计算机上进行的超参数调整显著改善了模型的物理性能。还展示了所得模型在支持 Nvidia、AMD 和 Intel Habana 卡的硬件处理器上具有高度可移植性。最终证明了该模型可以在由径迹和电量计击中构成的高粒度输入上进行训练,从而获得与基线相竞争的物理性能。根据可寻找、可获取、可互用和可复用(FAIR)原则发布了用于重现研究的数据集和软件。