- 基于扩散的故障采样技术对于网络物理系统
在高维领域中验证安全关键的自主系统(如机器人)是一个重大挑战。我们提出使用条件降噪扩散模型对故障分布进行采样,并经验证在高维机器人验证任务中相比现有的黑盒技术,能够提高采样效率和模态覆盖。
- 后验预测评估中的困难理解与缓解
使用重要性抽样方法通过在测试时间上优化信噪比的变分代理提供了更准确的预测后验密度估计。
- 高速公路增强学习
学习多步骤离线数据集合的核心问题是强化学习中一项重要的问题。本文提出了一种新的、无 IS 影响的、多步骤离线方法,通过引入一个名为高速公路门的机制,使得算法能够有效地利用未来较远时刻的信息并收敛到最优值函数。在具有延迟奖励的任务中,我们的新 - MM基于动量的联邦强化学习与交互沟通效率
Federated Reinforcement Learning (FRL) algorithm, MFPO, enhances data utilization by controlling policy gradients using - 策略梯度与主动重要性抽样
通过交替使用最小方差行为策略的对交叉熵估计和实际策略优化,结合防御性重要性采样,我们提供了一个迭代算法,理论上分析了该算法的收敛速度,并提供了经过数值验证的实际版本,展示了在策略梯度估计方差和学习速度方面的优势。
- 基于体素重要性的高效放射治疗计划
通过使用代表性的信息体素子集,我们减少了辐射治疗计划中耗时的优化问题,提高了规划效率同时保持或增加了计划质量。为了降低优化问题的计算复杂性,我们提出了通过重要性抽样对体素集合进行子采样的方法。我们根据从一个包含简化探测目标的简单优化问题的预 - ICLRVerlet 流:流动式生成模型的精确似然积分器
本文介绍了 Verlet 流,这是一类基于 Hamiltonian 动力学的增广状态空间的连续正则化流 (CNFs),用于计算模型似然的近似,以克服在重要性采样 Boltzmann 分布时,需要精确似然度的限制。在实验中,我们证明了常用的 - 自适应掩码子网络学习多模态优化的均衡技巧
通过引入互信息率确定重要性,并采用非均匀自适应采样和前景子网络选择进行参数更新,从而平衡多模态学习,该研究提出了一种新的重点抽样的元素级联合优化方法,成为自适应掩码子网络考虑模态重要性 (AMSS),并通过收敛分析证明了 AMSS 策略的可 - 通过重要性采样在自然策略梯度中重新使用历史轨迹:收敛性和收敛速率
本文研究了一种重用历史轨迹的自然策略梯度方法变体,并证明了所提梯度估计器的偏差在渐近上是可以忽略的,算法收敛且重用过去的轨迹有助于提高收敛速度。我们进一步将所提估计器应用于流行的策略优化算法,如信任区域策略优化,并在经典基准测试上验证了我们 - 竞技游戏离线虚构自我对弈
该研究介绍了 Off-FSP,这是第一个面向竞技游戏的实用无模型离线 RL 算法。通过调整固定数据集的权重以重要性采样的方式与各种对手进行模拟交互,学习最佳响应以及应用离线自我对弈学习框架,并进一步实现虚构自我对弈 (FSP) 以近似纳什均 - 比较基于重要性采样方法的类别不平衡效应缓解
在这项研究中,我们对 importance sampling 技术中的三种技术进行了探索和比较,包括 loss reweighting、undersampling 和 oversampling,并发现对于具有不平衡类别的模型,加权损失和欠采 - 非策略分布 Q ($λ$): 无重要性抽样的分布式强化学习
介绍了一种新的离线策略分布式 Q (λ) 评估算法,它与已有的算法不同之处在于不使用重要性抽样,并且在与符号测度的交互过程中具有独特的性质。通过表格实验验证了分布式 Q (λ) 的算法性质和理论洞见的有效性,并展示了将 Q (λ) 与 C5 - 循环群投影用于枚举准循环码诱捕集
介绍了一种在准循环码中枚举和评估困陷集的新方法,利用准循环属性,该方法使用一种表格技术来简化估计困陷集的伪码字权重的重要性采样步骤,提出的方法基于提供的定理建立的数学框架,阐明了投影和提升转换对伪码字的行为。
- 使用神经网络偏差势加速稀有事件采样
该研究论文介绍了一种将重要性抽样与深度神经网络相结合的实用方法,提高了稀有事件的采样效率,并在计算物理学和材料科学领域对稀有事件进行了研究和比较。
- 目标测度扩散映射的尖锐误差估计及在转变度问题中的应用
通过对 Target Measure Diffusion map(TMDmap)进行错误估计,我们发现它具有重要的抽样能力,能够对任意密度的数据进行输入,控制一致性误差,并在分析由过阻尼朗之万动力学系统中的罕见事件的过渡路径理论框架中,特别 - AAAI利用流匹配和神经重要性抽样推断系外行星的大气特性
大气检索通过估计观测光谱中的大气参数来表征外行星,通常将其作为贝叶斯推断问题来解决。我们探索了基于流匹配后验估计(FMPE)的机器学习方法用于大气检索,并发现在这种情况下,它比神经后验估计(NPE)更准确,但比嵌套采样方法的准确性稍低。我们 - RainAI -- 卫星数据降水即时预测
通过使用 2D U-Net 模型进行空时特征学习,通过重要性采样和数据集准备,以及研究交叉熵损失函数、条件时间领先和上采样方法,提升天气预报准确性。
- 通过软挖掘加速神经场训练
我们通过有效选择采样位置的方法来加速神经场训练,通过软采样技术基于重要性采样来改进收敛速度和训练质量,我们使用 Langevin Monte-Carlo 采样来实现这个想法,以实现更高收敛速度,研究代码和相关资源可以在该 https URL - TSDF-Sampling: 使用截断有符号距离场的高效神经表面采样
通过使用截断有符号距离场(TSDF)的方法,本研究提出了一种能够减少采样数量的新方法,有效提高了多视图神经表面重建的推断速度,同时保持了渲染质量。该方法在各种神经表面场模型中都能被可靠地插入使用,并在性能方面表现出色。
- 关于采样对深度序贯状态估计的影响
在这篇论文中,通过重要性采样将序贯模型与 DKF 框架相结合,得到了 IW-DKF 方法,通过降低边际对数似然估计的方差,改进了生成建模性能和状态推断性能。