以光速学习扩散
基于扩散模型的条件采样方法,在黑盒优化中生成接近最佳解且保留设计的潜在结构,通过建立理论模型和进行实验验证,证明了奖励导向扩散模型在黑盒优化中的效率和准确性。
Mar, 2024
通过引入一种可以上界反向 Kullback-Leibler 散度且避免要求确切样本似然的损失函数,本研究提出了一种能够解决在不依赖相应训练数据的情况下从难以处理的离散集合中进行采样的问题的方法,并展示了该方法在无数据组合优化中实现了最先进的性能。
Jun, 2024
利用连续动力系统设计一种新型去噪网络,以提高扩散模型的参数效率、收敛速度和噪声鲁棒性。与基准模型相比,该模型具有约四分之一的参数量和百分之三十的浮点操作数(FLOPs),推理速度提高了 70%,并且收敛到了更好的质量解。
Oct, 2023
通过将极大化模型的学习能力赋予于少样本学习,即仅通过少量样本快速学习,是人工智能的一个核心挑战。本文提出了一种基于扩散模型的元学习算法 MetaDiff,通过将渐变下降优化器建模为扩散模型,并以去噪的方式对模型权重的优化过程进行建模,从而实现了高效的训练,大大减轻了内部路径的内存负担和梯度消失的风险,在少样本学习任务中优于现有的基于渐变的元学习算法家族。
Jul, 2023
通过提出一种新颖的去随机扩散过程,我们加速了离散扩散模型的算法;我们还引入了一种连续时间采样算法,能够比有限步长的离散时间采样算法提供更好的样本质量。大量实验表明,在自然语言生成和机器翻译任务中,我们的方法在离散扩散模型的生成速度和样本质量方面表现出优越性。
Dec, 2023
我们提出了一种统一的框架来在扩散模型中实现有效的图像生成,其中搜索最佳时间步骤序列和压缩模型架构,无需进一步的训练。通过引入两阶段进化算法和使用生成和真实样本之间的 FID 评分来加速搜索过程,该方法在仅使用几个时间步骤时实现了出色的性能。
Sep, 2023
通过对扩散模型进行调查,我们希望能更好地理解它们的预测与基于物理计算的结果之间的比较,以利用机器学习来显著加速电子结构计算,而无需昂贵的原理数据集进行训练。我们发现一种流行的扩散模型用于全新分子生成的推理过程可以分为探索阶段和弛豫阶段,其中模型选择原子种类的同时调整原子坐标以找到低能几何形状。随着训练的进行,我们发现该模型最初学习的是位能曲面的一阶结构,然后逐渐学习高阶结构。我们还发现扩散模型的弛豫阶段可以用于对构象进行玻尔兹曼分布采样,并进行结构弛豫。对于结构弛豫,该模型对小型有机分子的能量较经典力场产生的结构低约 10 倍。在密度泛函理论 (DFT) 弛豫中,从扩散生成的结构开始与从经典力场弛豫的结构开始相比,可以使 DFT 弛豫速度提高超过 2 倍。
Nov, 2023