- METRIK: 使用输入遮盖的转换器进行高效测量的随机对照试验
采用计划失踪设计的研究论文提出了一种名为 METRIK 的框架,该框架能够通过学习输入屏蔽层实现在少量先验数据的基础上计算 RCT 特定的 PMD,从而提高采样效率和填补性能,并将需要手动删除 RCT 中的指标的需求消除。
- 具有最优协方差匹配的扩散模型
本文通过使用最近提出的全协方差矩匹配技术,引入了一种学习协方差的新方法,以显著提高采样效率,并展示了该方法如何有效地增强马尔科夫和非马尔科夫扩散模型家族的采样效率。
- Cometh:一种连续时间离散状态的图扩散模型
通过整合图数据到连续时间扩散模型框架中,我们提出了 Cometh,一种连续时间离散状态图扩散模型,以充分利用连续时间和离散状态扩散模型的优点,在大量的分子和非分子基准数据集上表明,整合连续时间会在各个指标上显著提高离散状态扩散模型的性能。
- 学习离散去噪扩散 ODEs
LD3 是一个轻量级的学习时间离散化的框架,可在采样 Diffusion ODE 时与各种求解器结合使用,从而提高采样效率并减少计算开销。
- 演化强化学习的合作协同进化
本文提出了一种新颖的合作共进化强化学习(CoERL)算法,旨在解决高维度神经网络优化效率问题,通过将策略优化问题分解为多个子问题并进化各个子问题的神经网络种群,使用部分梯度来更新策略,以提高采样效率。在六个基准运动任务上的实验表明,CoER - 潜在扩散模型的缩放特性:更大不一定更好
通过对已建立的文本到图像扩散模型进行经验分析,我们研究了模型规模如何影响不同采样步数下的采样效率,并发现了一个意外的趋势:在给定推理预算的情况下,较小的模型经常在生成高质量结果方面胜过较大的等价物。此外,我们通过应用各种扩散采样器,探索不同 - 基于约束采样优化的扩散模型
我们提出了使用扩散模型在数据流形上进行优化的方法,以解决具有未知约束的实际优化问题。通过在 Boltzmann 分布和扩散模型学习的数据分布之间进行采样,我们将原始优化问题转化为采样问题,以限制优化过程在数据流形上进行。通过在初始阶段聚焦在 - CVPR优化时间步长加速扩散采样
通过设计一个优化问题,并使用约束信任区域方法,我们提出了一种针对特定数值 ODE 解算器的扩散概率模型 (DPMs) 寻找更合适的时间步长的通用框架,该框架能显著改善图像生成性能。
- 基于扩散生成模型的快速随机采样探索
在增广空间中的预训练扩散模型中,我们提出拆分积分器来改善随机抽样的速度,通过对常用于分子动力学中的拆分积分器进行改进,我们提出了减少拆分积分器的几种原则性修改来提高抽样效率,我们的随机抽样算法在 CIFAR-10 上实现了 FID 得分 2 - 通过多阶段框架和定制的多解码器结构提高扩散模型的效率
通过多阶段框架和多解码器 U-net 架构,我们提出了一种增强扩散模型训练和采样效率的方案,通过定制每个时间步长的不同参数,同时保留所有时间步长共享的通用参数,有效地分配计算资源并减轻阶段间干扰。
- 扩散模型采样调度器
本研究提出了在相同采样过程的不同采样步骤中使用不同的采样器(ODE/SDE)的可行性,并通过实验证明这种多采样器调度在一定程度上改善了采样结果。特别是通过在早期采样步骤中使用 SDE 和在后期采样步骤中使用 ODE 的组合调度,解决了使用两 - ESRL: 高效基于采样的序列生成的强化学习
通过引入两阶段取样和动态取样方法,我们提出了一种提高强化学习中序列生成模型取样效率的方法。我们在传统的序列生成任务上进行了实验,包括机器翻译和摘要生成。实验结果表明,这种高效取样的强化学习方法 ESRL,在训练效率和内存消耗方面都优于基线方 - 全切片图像语义分割中的主动学习自适应区域选择
本文提出了一种基于区域的主动学习方法,可以更高效地训练监督分割模型,以实现乳腺癌转移细胞分割的任务,并在公共数据集(CAMELYON16)上验证了这种方法的有效性。
- 自适应条件分位数神经过程
本文提出了一种新的神经过程成员 Conditional Quantile Neural Processes(CQNPs),采用量化回归来对复杂的分布进行建模,通过学习估计有信息量的分位数来增强抽样效率和预测准确性,并在实验数据集上与基线算法 - 控制不变集增强型安全强化学习:提高采样效率,保证稳定性和鲁棒性
本文提出了一种新颖的 RL 训练方法,控制不变集增强 RL,以提高样本效率和稳定性保证,通过 CIS 在奖励设计、初始状态采样和状态重置程序中实现,同时加入安全监管人员以保证稳定性,研究结果表明这种方法在离线训练中能够显著提高样本效率,在在 - 基于控制不变集增强型强化学习的过程控制:提高采样效率和保证稳定性
本文提出了一种新的强化学习培训方法,称为控制不变集(CIS)增强 RL,该方法通过控制不变集的优势改善稳定性和采样效率,其中包括离线和在线的两个学习阶段,使用 CIS 来设计奖励、采样初始状态和状态重置程序,并在状态不在 CIS 时重新训练 - 无需重要性采样的 Actor-Critic 方法的离线校正
本文研究了基于离线数据的深度强化学习算法,提出了一种新的策略相似度度量方法来提高算法的采样效率和泛化能力,并且证明了该方法可以实现安全的离线学习。实验证明,该方法相较于其他竞争算法在大多数情况下能够更高效地提高学习效率。
- EfficientNeRF: 高效神经辐射场
本文提出 EfficientNeRF,一种高效的基于 NeRF 的方法,用于表示 3D 场景和合成新视图图像。通过在粗略和精细阶段分别提出有效的和关键的采样方法,以显著提高采样效率。同时,设计一种新的数据结构来加速整个场景的缓存以加速渲染速 - 基于熵的自适应 Hamiltonian Monte Carlo
本文提出了一种基于梯度的算法,允许通过鼓励 Leapfrog 积分器具有高接受率的方式来适应质量矩阵,最大化建议熵的近似值,实验证明该自适应方法可以通过调整质量矩阵来提高 HMC 的性能。
- 利用标准化流高效建模格点场论中的平凡化映射:首次探究可扩展性
本文介绍使用概率图模型,如刻画了独立同分布及网络参数的全贝叶斯网络,学习诱导先前未知的损失函数与标签之间的概率分布,并为之构建一个先验分布,以此来缓解过拟合及提高泛化性能。