Alpha Zero 物理：使用 Alpha Zero 进行符号回归以找到物理学中的分析方法

Nov, 2023

Alpha Zero 物理：使用 Alpha Zero 进行符号回归以找到物理学中的分析方法

Alpha Zero for Physics: Application of Symbolic Regression with Alpha Zero to find the analytical methods in physics

Yoshihiro Michishita

TL;DR使用符号回归及 Alpha Zero 算法的物理分析方法研究框架，展示了其在 Floquet 系统中获得高频扩展的潜力，可能发展出物理学的新理论框架。

Abstract

machine learning with neural networks is now becoming a more and more powerful tool for various tasks, such as natural language processing, image recognition, winning the game, and even for the issues of

machine learning neural networks symbolic regression alpha zero algorithm physics

发现论文，激发创造

AI Feynman：一种基于物理启发的符号回归方法

通过将神经网络和物理启发式技术结合起来，我们开发了一种递归多维符号回归算法，将其应用于来自费曼物理学讲义的 100 个方程，并成功发现了所有未知函数方程。

May, 2019

AI-Lorenz：一种用于深度学习物理推理的黑盒和灰盒混沌系统鉴定框架

通过从嘈杂和稀疏的可观测数据中识别微分方程，我们开发了一个框架，学习建模复杂动力行为的数学表达式，从而填补了基于经验数据而非已知物理机制的系统的数学模型的空白。

Dec, 2023

物理符号优化

我们提出了一个框架来约束自动顺序生成方程式以通过构造符合量纲分析规则。结合增强学习，我们构建了 Phi-SO，一种从物理数据中恢复分析函数的物理符号优化方法，利用单位约束。我们的符号回归算法在已知物理单位的情况下取得了最先进的结果，在存在噪音（超过 0.1%）的情况下在 SRBench 的 Feynman 基准测试中表现出色，并且即使在存在显著（10%）级别的噪音下也表现出弹性。

Dec, 2023

利用 FPGA 进行符号回归用于快速机器学习推理

本篇论文提出一种利用符号回归技术和 FPGA 实现的机器学习模型优化算法，成功地将一个由 3 层神经元组成的模型大幅优化，准确率超过 90%，执行时间缩短了 13 倍。

May, 2023

从零开始发现适应性符号算法

提出了一种基于 AutoML-Zero 的方法 AutoRobotics-Zero（ARZ），该方法能够从零开始发现可以适应环境变化的策略。该方法采用线性寄存器机制来构建具有完整表达能力的控制算法，并在适应突发环境变化时即时调整模型参数和推理算法。在仿真的四足机器人上进行了实验，成功演化出了安全的控制策略，以避免在单个肢体意外折断时造成跌倒。与两种流行的神经网络基准相比，ARZ 方法表现出更大的鲁棒性，并能够构建简单且可解释的控制策略。

Jul, 2023

统计力学与机器学习理论之间等价框架的代数研究回顾与展望

数理力学和机器学习理论之间的数学等价性是自 20 世纪以来已知的，基于这种等价性的研究为理论物理和统计学习理论提供了新的方法论。本文回顾和展望了机器学习理论中的代数研究，介绍了最近的进展，即正在基于代数学习理论构建人工智能的理论基础。

May, 2024

AlphaZero 深度探索下的量子动力学全局优化

采用 AlphaZero 算法中的深度神经网络和引导树搜索，结合深度前瞻技术，实现了量子优化过程的全新探索方式。AlphaZero 算法在三类控制问题上经过应用和基准测试，能够显著提高优质解集的质量和数量，并能够自主学习预期外的隐藏结构和全局对称性。

Jul, 2019

AI Feynman 2.0: 基于图模块化的帕累托最优符号回归

本篇研究提供一种改进的符号回归方法，利用 Pareto 最优化原理寻求最适合数据的公式，同时从神经网络的梯度属性中发现广义对称性，通过正常流将其推广到只有样本分布的概率分布上，并采用统计假设检验加速鲁棒性暴力搜索。

Jun, 2020

类符号回归：全都要拟合

引入 “类别符号回归”—— 一个首个框架，能够自动找到一个准确适用于多个数据集（每个数据集都由其可能独特的拟合参数集）的单一分析函数形式。通过应用于一系列合成玩具案例数据集，我们展示了这种新颖方法的有效性，并成功从模拟轨道（近似恒星流）的集合中提取出一个解析星系势能，展示了其在天体物理学中的实用性。

Dec, 2023

零阶 Oracle 学习到学习

本文将 learning to learn（L2L）框架扩展到零阶（ZO）优化设置，其中没有明确的梯度信息，并将学习的优化器建模为循环神经网络（RNN），通过 ZO 梯度估算器近似梯度，并利用以前迭代的知识产生参数更新，进一步引入另一个 RNN 来学习高斯采样规则并动态指导查询方向采样。我们的学习优化器在合成和实际 ZO 优化任务中表现出优异的收敛率和最终解决方案，特别是在 Black-box Adversarial Attack 任务中。

Oct, 2019