- 用于电网运行风险评估的图神经网络
研究了图神经网络(GNN)替代物在电网日常运营中基于蒙特卡罗(MC)取样的风险量化中的实用性。通过使用监督学习训练 GNN 替代物,它们被用于获取感兴趣的数量(运行储备、输电线路流量)的蒙特卡罗(MC)样本,给定(提前几小时的)概率性风力发 - 可证明的基于得分的生成先验的概率成像
本文提出了一种基于蒙特卡洛方法的插拔算法,用于解决不适定问题中的图像重建及不确定性量化,并通过后验抽样结合生成先验实现高质量图像重建和不确定性量化。在理论分析中,证明了该算法的收敛性,即使在存在非对数凹似然函数和非完美评分网络的情况下,也能 - 简化蒙特卡洛序列重采样的方差缩减
通过提出一种基于确定性域的重复中值遍历策略,我们在重采样中实现了较低的方差,相比其他重采样方法,快速而准确地逼近了非线性情况下的隐藏马尔可夫模型。
- 神经马尔可夫跳进程
本文提出了一种基于神经常微分方程的变分推断算法,在 Markov 跳跃过程中通过学习神经连续时间表示来近似后验分布,相比于 Monte Carlo 和期望最大化方法具有更高效的性能。
- 黑盒变分推断收敛
本文提供了第一篇关于全黑箱变分推断的收敛性保证,特别是蒙特卡罗变分推断。作者通过与传统算法相比的分析,证明了使用鲁棒的变分族文件和负责的算法设计,特别是使用近端随机梯度下降,可以实现最强的已知收敛速率保证。
- 基于 Wordle 游戏探索词汇难度及其影响因素
通过使用 Monte Carlo 和 Markov 模拟 Wordle 游戏猜词过程并结合 Lasso 回归和二次规划计算,加上通过因子分析后的词汇属性变量中的相关因素,通过有序 logistic 回归建立难易程度和词汇属性之间的关系,预测 - 无监督采样促进基于随机人类轨迹的预测
本论文提出了一种名为 BOsampler 的新方法,通过贝叶斯优化的方法,在长尾效应区域探索潜在路径的过程中,提高了随机预测的采样效率,该方法不需要重新训练,可与现有的随机预测模型集成,实验结果表明该方法的有效性。
- MM测试自旋玻璃基态的深度强化学习启发式算法:更大的全局视角
该论文提出了一种基于增强学习的深度学习方法来增强组合优化启发式的能力,并在多个自旋玻璃基态问题中进行了实验,展示了该方法相对于其它启发式方法的优越性。
- 蒙特卡罗随机长度情节 MDPs 的 UCB 收敛性
通过使用 MC-UCB 算法,可以在一大类马尔可夫决策问题(包括像 Go 和黑杰克这样的) 中,使 Q 函数收敛到最优,从而改善强化学习的效果。
- 使用强化学习解决乌尔王宫游戏
本研究采用蒙特卡罗、Q 学习和预期 Sarsa 等不同的方法来训练智能体,学习下古老的策略性游戏乌尔王的最优策略,并表现出不错的结果和学习能力。其中,预期 Sarsa 在学习速度方面表现出色。
- ICML使用间隔的直通估计器训练离散深度生成模型
提出一种灵活的 Gapped Straight-Through (GST) 估计器来降低离散随机变量的梯度估计中的高方差,在 MNIST-VAE 和 ListOps 的两项离散深度生成建模任务中表现优异,比其他策略具有更好的性能。
- ICLR评论家顺序蒙特卡罗
本文介绍了 CriticSMC 算法,结合学习的 Soft-Q 函数启发式因子实现了一种规划为推理的算法。实验表明该算法在高维仿真驾驶任务中显著降低了碰撞率,同时保持了较高的计算效率和真实性。
- ICLR近线性时间内的分布压缩
介绍了一种用于加速薄算法的元措施 Compress++,其可在更短的时间内达到与输入算法几乎相当的精度。
- 使用线性函数逼近实现高效的本地规划
研究使用线性函数逼近和模拟器的查询和计算高效的计划算法,在这种情况下,我们提出了名为 “Confident MC-LSPI” 和 “Confident MC-Politex” 的两种算法,同时证明了我们的算法在特征,有效规划控制范围和目标次 - 针对良好条件分布的 Metropolized 采样方法下限
给出了使用两种蒙特卡罗采样方法(MALA 和 HMC)在良好条件的分布下性能的下界,并确定了每种方法的最短混合时间和松弛时间。该文还发现了跃点积分和 Chebyshev 多项式之间的新连接。
- 使用渐进采样和非均匀 Rademacher Bounds 估算介数中心性的 SILVAN 算法
提出一种新型高效算法 SILVAN,基于蒙特卡洛实证 Rademacher 平均值的新约束,通过渐进采样方法计算网络图中各节点的中介中心性,建立新的估算方案提供节点中介中心性的非均匀偏差边界并确定样本所需的数量,相比于其他算法在样本数量和准 - AAAI预测与评估:通过潜在未来预测分解价值估计
本文提出了一种名为 “Value Decomposition with Future Prediction” 的强化学习算法,通过将价值函数分解为潜在未来动态部分和与策略无关的轨迹回报部分,提高了价值估计的准确性,并在 OpenAI Gym - 重要性抽样的进展
本文介绍了 Monte Carlo 技术中的 Importance Sampling 算法及其应用,重点探讨了多重 IS 和自适应 IS 这两种先进的 IS 变体。
- 部分子密度和碎裂函数的同时蒙特卡罗分析
本文采用蒙特卡罗方法,综合分析高能量粒子之间以及粒子与带电子和带荷强子的散射数据,结合半含深度弹性散射和单含 $e^+ e^-$ 湮灭数据,并通过新的多步拟合策略和更灵活的参数化方法得出了 JAM20-SIDIS 解析的 PDF 和 FF, - 一种基于贝叶斯算法的反合成化学方法
使用机器学习技术,采用 Bayesian 推理和蒙特卡罗搜索算法,逆向发现了合成路线,能够以较高的准确率运用于合成有机化学方面。