快速和功能性的结构化数据生成器基于非平衡物理学

Jul, 2023

快速和功能性的结构化数据生成器基于非平衡物理学

Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics

Alessandra Carbone, Aurélien Decelle, Lorenzo Rosset, Beatriz Seoane

TL;DR本研究提出了一种新的训练算法，利用非平衡效应来提高受限玻尔兹曼机的能力，并成功地应用于四种不同类型的数据以产生高质量的合成数据。

Abstract

In this study, we address the challenge of using energy-based models to produce high-quality, label-specific data in complex structured datasets, such as population genetics, RNA or protein sequences data. Traditional training methods encounter difficulties due to inefficient

energy-based models markov chain monte carlo restricted boltzmann machine synthetic data non-equilibrium effects

发现论文，激发创造

快速且准确地训练和抽样受限波尔兹曼机

通过凸优化过程将数据集的主要方向整合到低秩 RBM 中，从而通过静态蒙特卡罗过程实现平衡分布的高效采样，成功训练 RBM 来捕捉之前方法失败的高度结构化数据集中的全部多样性，并提出了一种新的采样方法 - 平行轨迹调整，使得能够比之前的 MCMC 方法更快地采样训练模型的平衡分布并更好地估计对数似然。

May, 2024

基于受限玻尔兹曼机的有效耦合推断

通过在受限玻尔兹曼机的能量函数和包括自旋之间高阶相互作用的有效伊辛自旋哈密顿量之间建立直接映射，我们提出了一种简单的解决方案，可以描述复杂数据集，实现学习正确的交互网络，并为其在建模有趣数据集中的应用铺平了道路。

Sep, 2023

Boltzmann 生成器 -- 利用深度学习采样多体系统的平衡态

利用深度学习和统计力学，我们开发了 Boltzmann Generators，它们能够生成代表性的凝聚态物质系统和蛋白质的无偏一次平衡样品。

Dec, 2018

用受限玻尔兹曼机加速蒙特卡罗模拟

本文提出了将人工神经网络用于蒙特卡罗方法的改进，使其在统计物理问题中的混合时间得以加速，具体应用于 Falicov-Kimball 模型，并在其相变点附近展示了接受比率和自相关时间的提高。

Oct, 2016

应用非平衡热力学的深度无监督学习

本文提出使用煞费苦心、模拟非平衡统计力学的方法，通过迭代向前的扩散过程来系统性地破坏数据分布中的结构，并学习一个可以还原数据结构的逆向扩散过程，从而快速学习、采样、评估深度生成模型中的概率。

Mar, 2015

利用 Jarzynski 等式高效训练基于能量的模型

本文介绍了一种基于 Jarzynski 平等和序贯蒙特卡洛抽样工具的改进型未校正 Langevin 算法来更有效地计算交叉熵的梯度，避免了标准对比散度算法中存在的不可控逼近问题，在高斯混合分布和 MNIST 数据集上的实验结果均显示该方法优于对比散度算法。

May, 2023

自然离散组合突变易导致数据误差的机器学习中的数据规模缩放：以肽和小分子为案例研究

通过研究在蛋白质或有机小分子等易突变的离散组合空间中训练的机器学习（ML）模型的数据误差缩放行为的趋势，我们发现了学习过程中出现的不连续的单调阶跃现象，其表现为特定训练数据阈值时测试误差的快速下降。我们发现了饱和和渐近衰减两种学习模式，并发现它们取决于训练集中含有的突变复杂性水平（即突变数量）。本研究对于在可突变离散空间中的机器学习，如化学性质或蛋白质表型预测，并改善基本统计学习理论的理解具有重要意义。

May, 2024

通过不平衡数据分类基准评估量子生成模型

使用可解释的人工智能技术对从 20 个真实数据集生成的合成数据进行分析，探究了一种混合量子 - 经典神经网络生成模型的特点和适用性，并与处理类别不平衡的最先进方法进行比较。

Aug, 2023

用分子力场进行可微转角采样

本文介绍一种基于神经网络的 Boltzmann 生成器，以取代传统 molecular dynamics 方法，加速复杂大分子如蛋白质的能量表面探索。

Feb, 2023

一种基于生成式受限玻尔兹曼机的高维动作数据建模方法

本文提出了在 RBMs 的能量函数中引入另一项以显式地建模输入数据中的局部空间交互作用，以建模全局动态和本地空间交互作用的理论扩展，通过提出的学习方法，在两个计算机视觉应用程序上评估了改进的 RBM 模型：面部表情识别和人体动作识别，并在基准数据库上展示了所提出算法的有效性。

Oct, 2017