TherML: 机器学习的热力学

ICMLJul, 2018

TherML: Thermodynamics of Machine Learning

PDF

Alexander A. Alemi, Ian Fischer

TL;DR本研究提供了一个框架，可以推理出机器学习中广泛类别的目标。我们建立了一种形式化的对应关系，讨论了其与热力学之间的关系及其意义。

Abstract

In this work we offer a framework for reasoning about a wide class of existing objectives in →

machine learning objectives framework thermodynamics reasoning

发现论文，激发创造

机器学习系统的温度

开发了一种热力学理论用于机器学习系统，与物理热力学系统相似的是，机器学习系统也具有能量和熵的特征。我们引入了温度的概念，并建立了一个基本的热力学框架来处理具有非 Boltzmann 分布的机器学习系统。我们将机器学习系统看作具有不同状态的系统，并将模型训练和更新解释为状态相变的过程。我们将机器学习系统的初始潜在能量描述为模型的损失函数，并遵循最小潜在能量原则。我们推导了系统在相变过程中的温度，突出温度作为系统数据分布和机器学习训练复杂性的重要指标。此外，我们将深度神经网络视为具有全局温度和每层局部温度的复杂热能引擎，并介绍了神经网络的工作效率概念，主要取决于神经激活函数。然后，我们根据工作效率对神经网络进行分类，并将神经网络描述为两种类型的热能引擎。

Apr, 2024

表示学习的自由能原理

本论文采用机器学习与热力学的形式联系，表征学到的表示在迁移学习中的质量；我们讨论了模型信息论函数，如速率、失真和分类损失如何位于凸平衡面上。我们提出了遵守约束的动态过程，例如，一种等分类过程，它在平衡面上进行速率和失真的交换以保持分类损失不变。我们演示了如何在保持分类损失不变的情况下，将表示从源数据集转移到目标数据集。最后，在标准图像分类数据集上提供了理论结果的实验验证。

Feb, 2020

机器学习热力学时间箭头

机器学习算法可以使用系统的微观轨迹作为输入来辨别时间箭头的方向，其性能符合非平衡态统计力学所预测的基本极限。算法的决策过程解释了发现了潜在的热力学机制和相关物理观测量。结果表明，机器学习技术可以用于研究非平衡态系统，并最终揭示物理原理。

Sep, 2019

利用深度学习构建定制热力学

基于基本的物理原理，特别重要的是对复杂动态系统进行宏观动力学建模，通过学习化简的热力学坐标和在这些坐标上解释动力学来实现。我们通过在聚合物拉伸和空间流行病的研究中验证了这种方法的有效性，表明我们的方法适用于广泛的科学和技术应用。

Aug, 2023

端口多辛神经网络：物理系统的热力学知识驱动机器学习

基于 Port-Hamiltonian 形式主义，我们开发了适用于复杂物理系统的机器学习归纳偏差，以构造满足热力学原则（能量守恒，非负熵产生）的学习物理。

Nov, 2022

将科学知识与机器学习相结合，用于工程和环境系统

本文探讨了机器学习与传统基于物理模型的建模方法相结合解决复杂科学和工程问题的创新方法，总结了这些方法的应用领域，并描述了用于构建基于物理引导的机器学习模型和混合物理 - 机器学习框架的分类方法，提出了现有技术的分类方法，揭示了知识漏洞和不同学科间方法的潜在交叉点，可用作未来研究的思路。

Mar, 2020

使用玻尔兹曼机学习热力学

通过学习物理系统中热力学量的 Boltzmann 机器，通过自发的学习机器，我们训练了 Boltzmann 机器，并通过其生成的自旋状态检验热力学可观测量与直接 MC 采样的差距，证明了 Boltzmann 机器能够忠实地再现物理系统的可观测量，并观察到随着系统接近临界状态需要更多的神经元以获得准确的结果。

Jun, 2016

通过自治量子热机实现的热力学计算

基于自治量子热机的物理模型可以实现任何线性可分函数，并可作为神经网络的物理模拟实现以及热力学计算的平台。

Aug, 2023

基于热力学的神经网络用于物理现实混合现实

本文介绍了一种基于深度学习的方法，用于计算混合现实中用户实时交互引起的（可能是非线性和耗散性的）可变形物体的动态响应，以保证虚拟世界的正确性和真实性。两个具体示例证明了该方法的高效性。

Oct, 2022

学习生成参数概率模型的随机热力学

我们通过建立与热力学变量的联系，将生成式机器学习问题形式化为参数概率模型（PPM）的时间演化，研究了模型参数（θ）和生成样本（X）之间的热力学交换。我们发现模型通过样本生成过程中的热量耗散来学习，导致模型参数熵增加，进而作为热库保存学到的信息。此方法提供了一个计算神经网络内信息论量的明确框架，并引入了两个信息论度量指标：记忆化信息（M-info）和学习化信息（L-info），用于追踪 PPM 学习过程中的信息动态流动。

Oct, 2023