只需 19 个参数：粒子物理学的微型神经网络

Oct, 2023

只需 19 个参数：粒子物理学的微型神经网络

19 Parameters Is All You Need: Tiny Neural Networks for Particle Physics

Alexander Bogatskiy, Timothy Hoffman, Jan T. Offermann

TL;DR粒子加速器和深度学习的低延迟任务中，轻量级快速的神经网络架构的需求增加。我们研究了一种最近的洛伦兹 - 排列对称架构 PELICAN，并提出了它的实例，只需 19 个可训练参数，当在顶夸克喷注的二分类任务中与成千上万个参数的通用架构进行对比时，表现更好。

Abstract

As particle accelerators increase their collision rates, and deep learning solutions prove their viability, there is a growing need for lightweight and fast →

particle accelerators deep learning neural network architectures low-latency tasks pelican

发现论文，激发创造

可解释的等变神经网络用于粒子物理学：PELICAN

PELICAN 是一种新颖的置换等变和洛伦兹不变或协变的拼接网络，它在分类和回归洛伦兹增强顶夸克的上下文中，特别是在识别和测量密集环境中 $W$ 玻色子的困难任务中，相比其他方法表现出更少的复杂性、更高的可解释性和原始性能。

Jul, 2023

使用振幅神经网络优化强子对撞机模拟

本文研究使用神经网络逼近矩阵元的方法进行精密现象学研究，比较其与传统模拟技术的效果可以实现模拟时间缩短，且在标准观测方面有很好的一致性。

Feb, 2022

用于大型预训练语言模型参数高效微调的神经架构搜索

探讨了一种基于网络剪枝的高效的神经架构搜索方法用于学习预训练模型的参数优化方法 (Parameter-efficient tuning)，并在 GLUE 上的实验结果表明算法的有效性以及 PET 网络结构设计的实际表现。

May, 2023

高能物理数据上的量子启发式机器学习

本文介绍如何应用张量网络作为量子启发机器学习技术，有效地分类来自 CERN 的大型强子对撞机数据，特别是分类所谓的 b - 喷注，并解释分类结果。同时，还认为张量网络在学习过程中根据所获取到的信息选择重要的特征并调整网络结构，在不需要重复学习过程的情况下实现精密分类或快速响应。这些结果为实现高频率实时应用奠定了基础，这是目前和未来 LHCb 事件分类的关键之一，能够触发每秒数千万个事件。

Apr, 2020

用于粒子探测器边缘低延迟推断的深度神经网络自动异构量化

本文介绍了一种利用分层、分参数类型的自动量化过程来设计深度神经网络模型的方法，旨在使模型能够在芯片上进行高精度、纳秒级推理和完全自动化部署。这对于 CERN 大型强子对撞机中的事件选择过程至关重要，其中资源严格限制，需要一种纳秒级的推理和降低 50 倍的资源消耗。

Jun, 2020

将图神经网络重新送回测试台进行高能粒子物理应用的案例研究

高能粒子碰撞中，基本碰撞产物通常会进一步衰变，形成具有预先未知多样性的树状分层结构。本文描述了一个典型的图神经网络（GNN）与深度全连接前馈神经网络体系结构的基准测试，并以在 CERN 的大型强子对撞机上在由质子 - 质子碰撞产生的带有顶夸克 - 反夸克对的最终态 X 的分类为物理案例进行对比。

Feb, 2024

粒子物理学中的 Lorentz 群等变神经网络

本文介绍一种基于洛伦兹群的有等变性的神经网络体系结构，其用于分类任务在粒子物理学中表现出的结果优于卷积神经网络和点云方法。

Jun, 2020

基于 FPGA 的深度神经网络在粒子物理中的快速推断

介绍了基于 FPGA 进行神经网络推理的案例研究，其使用高级综合技术（HLS）构建机器学习模型，旨在为粒子物理学的高速实时事件处理提供支持，适用于很多场合，如寻找新的暗扇区粒子和测量希格斯玻色子等。

Apr, 2018

用于粒子流重建的可扩展神经网络模型与万亿级数据集

研究了可扩展的机器学习模型，用于基于高粒度探测器模拟的高能电子 - 正电子碰撞的完全事件重建。比较了图神经网络和基于核的变压器，并证明两者在实现逼真的粒子流重建时，同时避免了二次内存分配和计算成本。展示了在超级计算机上进行的超参数调整显著改善了模型的物理性能。还展示了所得模型在支持 Nvidia、AMD 和 Intel Habana 卡的硬件处理器上具有高度可移植性。最终证明了该模型可以在由径迹和电量计击中构成的高粒度输入上进行训练，从而获得与基线相竞争的物理性能。根据可寻找、可获取、可互用和可复用（FAIR）原则发布了用于重现研究的数据集和软件。

Sep, 2023

仅需集合：基于 FPGA 的超快速喷注分类方法在 HL-LHC 中的应用

通过对基于机器学习的算法在可编程门阵列上进行准确的喷注风味分类的研究，展示了在输入规模和算法选择方面的延迟和资源消耗如何扩展，并提供了一种用于在 CERN LHC 的高亮度阶段进行标记的模型的初始设计。通过量化感知训练和高效硬件实现，我们展示了可以以较低的计算资源成本实现复杂架构（例如深度集合和交互网络）的 O（100）纳秒推理。

Feb, 2024