只需 19 个参数:粒子物理学的微型神经网络
PELICAN 是一种新颖的置换等变和洛伦兹不变或协变的拼接网络,它在分类和回归洛伦兹增强顶夸克的上下文中,特别是在识别和测量密集环境中 $W$ 玻色子的困难任务中,相比其他方法表现出更少的复杂性、更高的可解释性和原始性能。
Jul, 2023
探讨了一种基于网络剪枝的高效的神经架构搜索方法用于学习预训练模型的参数优化方法 (Parameter-efficient tuning),并在 GLUE 上的实验结果表明算法的有效性以及 PET 网络结构设计的实际表现。
May, 2023
本文介绍如何应用张量网络作为量子启发机器学习技术,有效地分类来自 CERN 的大型强子对撞机数据,特别是分类所谓的 b - 喷注,并解释分类结果。同时,还认为张量网络在学习过程中根据所获取到的信息选择重要的特征并调整网络结构,在不需要重复学习过程的情况下实现精密分类或快速响应。这些结果为实现高频率实时应用奠定了基础,这是目前和未来 LHCb 事件分类的关键之一,能够触发每秒数千万个事件。
Apr, 2020
本文介绍了一种利用分层、分参数类型的自动量化过程来设计深度神经网络模型的方法,旨在使模型能够在芯片上进行高精度、纳秒级推理和完全自动化部署。这对于 CERN 大型强子对撞机中的事件选择过程至关重要,其中资源严格限制,需要一种纳秒级的推理和降低 50 倍的资源消耗。
Jun, 2020
高能粒子碰撞中,基本碰撞产物通常会进一步衰变,形成具有预先未知多样性的树状分层结构。本文描述了一个典型的图神经网络(GNN)与深度全连接前馈神经网络体系结构的基准测试,并以在 CERN 的大型强子对撞机上在由质子 - 质子碰撞产生的带有顶夸克 - 反夸克对的最终态 X 的分类为物理案例进行对比。
Feb, 2024
介绍了基于 FPGA 进行神经网络推理的案例研究,其使用高级综合技术(HLS)构建机器学习模型,旨在为粒子物理学的高速实时事件处理提供支持,适用于很多场合,如寻找新的暗扇区粒子和测量希格斯玻色子等。
Apr, 2018
研究了可扩展的机器学习模型,用于基于高粒度探测器模拟的高能电子 - 正电子碰撞的完全事件重建。比较了图神经网络和基于核的变压器,并证明两者在实现逼真的粒子流重建时,同时避免了二次内存分配和计算成本。展示了在超级计算机上进行的超参数调整显著改善了模型的物理性能。还展示了所得模型在支持 Nvidia、AMD 和 Intel Habana 卡的硬件处理器上具有高度可移植性。最终证明了该模型可以在由径迹和电量计击中构成的高粒度输入上进行训练,从而获得与基线相竞争的物理性能。根据可寻找、可获取、可互用和可复用(FAIR)原则发布了用于重现研究的数据集和软件。
Sep, 2023
通过对基于机器学习的算法在可编程门阵列上进行准确的喷注风味分类的研究,展示了在输入规模和算法选择方面的延迟和资源消耗如何扩展,并提供了一种用于在 CERN LHC 的高亮度阶段进行标记的模型的初始设计。通过量化感知训练和高效硬件实现,我们展示了可以以较低的计算资源成本实现复杂架构(例如深度集合和交互网络)的 O(100)纳秒推理。
Feb, 2024