快速和功能性的结构化数据生成器基于非平衡物理学
通过凸优化过程将数据集的主要方向整合到低秩 RBM 中,从而通过静态蒙特卡罗过程实现平衡分布的高效采样,成功训练 RBM 来捕捉之前方法失败的高度结构化数据集中的全部多样性,并提出了一种新的采样方法 - 平行轨迹调整,使得能够比之前的 MCMC 方法更快地采样训练模型的平衡分布并更好地估计对数似然。
May, 2024
通过在受限玻尔兹曼机的能量函数和包括自旋之间高阶相互作用的有效伊辛自旋哈密顿量之间建立直接映射,我们提出了一种简单的解决方案,可以描述复杂数据集,实现学习正确的交互网络,并为其在建模有趣数据集中的应用铺平了道路。
Sep, 2023
利用深度学习和统计力学,我们开发了 Boltzmann Generators,它们能够生成代表性的凝聚态物质系统和蛋白质的无偏一次平衡样品。
Dec, 2018
本文提出了将人工神经网络用于蒙特卡罗方法的改进,使其在统计物理问题中的混合时间得以加速,具体应用于 Falicov-Kimball 模型,并在其相变点附近展示了接受比率和自相关时间的提高。
Oct, 2016
本文提出使用煞费苦心、模拟非平衡统计力学的方法,通过迭代向前的扩散过程来系统性地破坏数据分布中的结构,并学习一个可以还原数据结构的逆向扩散过程,从而快速学习、采样、评估深度生成模型中的概率。
Mar, 2015
本文介绍了一种基于 Jarzynski 平等和序贯蒙特卡洛抽样工具的改进型未校正 Langevin 算法来更有效地计算交叉熵的梯度,避免了标准对比散度算法中存在的不可控逼近问题,在高斯混合分布和 MNIST 数据集上的实验结果均显示该方法优于对比散度算法。
May, 2023
通过研究在蛋白质或有机小分子等易突变的离散组合空间中训练的机器学习(ML)模型的数据误差缩放行为的趋势,我们发现了学习过程中出现的不连续的单调阶跃现象,其表现为特定训练数据阈值时测试误差的快速下降。我们发现了饱和和渐近衰减两种学习模式,并发现它们取决于训练集中含有的突变复杂性水平(即突变数量)。本研究对于在可突变离散空间中的机器学习,如化学性质或蛋白质表型预测,并改善基本统计学习理论的理解具有重要意义。
May, 2024
使用可解释的人工智能技术对从 20 个真实数据集生成的合成数据进行分析,探究了一种混合量子 - 经典神经网络生成模型的特点和适用性,并与处理类别不平衡的最先进方法进行比较。
Aug, 2023
本文提出了在 RBMs 的能量函数中引入另一项以显式地建模输入数据中的局部空间交互作用,以建模全局动态和本地空间交互作用的理论扩展,通过提出的学习方法,在两个计算机视觉应用程序上评估了改进的 RBM 模型:面部表情识别和人体动作识别,并在基准数据库上展示了所提出算法的有效性。
Oct, 2017