TherML: 机器学习的热力学
开发了一种热力学理论用于机器学习系统,与物理热力学系统相似的是,机器学习系统也具有能量和熵的特征。我们引入了温度的概念,并建立了一个基本的热力学框架来处理具有非 Boltzmann 分布的机器学习系统。我们将机器学习系统看作具有不同状态的系统,并将模型训练和更新解释为状态相变的过程。我们将机器学习系统的初始潜在能量描述为模型的损失函数,并遵循最小潜在能量原则。我们推导了系统在相变过程中的温度,突出温度作为系统数据分布和机器学习训练复杂性的重要指标。此外,我们将深度神经网络视为具有全局温度和每层局部温度的复杂热能引擎,并介绍了神经网络的工作效率概念,主要取决于神经激活函数。然后,我们根据工作效率对神经网络进行分类,并将神经网络描述为两种类型的热能引擎。
Apr, 2024
本论文采用机器学习与热力学的形式联系,表征学到的表示在迁移学习中的质量;我们讨论了模型信息论函数,如速率、失真和分类损失如何位于凸平衡面上。我们提出了遵守约束的动态过程,例如,一种等分类过程,它在平衡面上进行速率和失真的交换以保持分类损失不变。我们演示了如何在保持分类损失不变的情况下,将表示从源数据集转移到目标数据集。最后,在标准图像分类数据集上提供了理论结果的实验验证。
Feb, 2020
机器学习算法可以使用系统的微观轨迹作为输入来辨别时间箭头的方向,其性能符合非平衡态统计力学所预测的基本极限。算法的决策过程解释了发现了潜在的热力学机制和相关物理观测量。结果表明,机器学习技术可以用于研究非平衡态系统,并最终揭示物理原理。
Sep, 2019
基于基本的物理原理,特别重要的是对复杂动态系统进行宏观动力学建模,通过学习化简的热力学坐标和在这些坐标上解释动力学来实现。我们通过在聚合物拉伸和空间流行病的研究中验证了这种方法的有效性,表明我们的方法适用于广泛的科学和技术应用。
Aug, 2023
基于 Port-Hamiltonian 形式主义,我们开发了适用于复杂物理系统的机器学习归纳偏差,以构造满足热力学原则(能量守恒,非负熵产生)的学习物理。
Nov, 2022
本文探讨了机器学习与传统基于物理模型的建模方法相结合解决复杂科学和工程问题的创新方法,总结了这些方法的应用领域,并描述了用于构建基于物理引导的机器学习模型和混合物理 - 机器学习框架的分类方法,提出了现有技术的分类方法,揭示了知识漏洞和不同学科间方法的潜在交叉点,可用作未来研究的思路。
Mar, 2020
通过学习物理系统中热力学量的 Boltzmann 机器,通过自发的学习机器,我们训练了 Boltzmann 机器, 并通过其生成的自旋状态检验热力学可观测量与直接 MC 采样的差距,证明了 Boltzmann 机器能够忠实地再现物理系统的可观测量,并观察到随着系统接近临界状态需要更多的神经元以获得准确的结果。
Jun, 2016
本文介绍了一种基于深度学习的方法,用于计算混合现实中用户实时交互引起的(可能是非线性和耗散性的)可变形物体的动态响应,以保证虚拟世界的正确性和真实性。两个具体示例证明了该方法的高效性。
Oct, 2022
我们通过建立与热力学变量的联系,将生成式机器学习问题形式化为参数概率模型(PPM)的时间演化,研究了模型参数(θ)和生成样本(X)之间的热力学交换。我们发现模型通过样本生成过程中的热量耗散来学习,导致模型参数熵增加,进而作为热库保存学到的信息。此方法提供了一个计算神经网络内信息论量的明确框架,并引入了两个信息论度量指标:记忆化信息(M-info)和学习化信息(L-info),用于追踪 PPM 学习过程中的信息动态流动。
Oct, 2023