关键词markov chain monte carlo sampling
搜索结果 - 10
- 基于深度强化学习的 POMDP 推断和鲁棒解决方案:铁路最优维护应用
本文提出一个结合推断和强化学习的框架,通过深度强化学习对 POMDP 问题进行鲁棒解决。通过 Markov Chain Monte Carlo 抽样来联合推断出所有的转换和观察模型参数,并将参数分布通过域随机化融入到模型不确定性的解决中,解 - 多层生成器学习联合潜空间 EBM 先验模型
本文提出了一种基于能量的模型 (EBM) 方法,通过在所有层的潜在变量上建立联合潜在空间 EBM 先验模型,以层内能量项捕捉每一层的内部上下文关系,跨不同层的潜在变量则通过联合校正。并提出联合训练方案 (最大似然估计 MLE 和基于推理模型 - 学习如何解决贝叶斯反问题:一种分摊变分推断方法
本文提出了一种基于深度神经网络参数化的先验分布方法,通过学习贝叶斯逆映射实现了实时推理。经过基准问题的验证,该方法的后验估计与马尔可夫链蒙特卡罗方法的对应结果一致,并在前向传递神经网络的代价下提供了观测的后验参数。
- 自回归神经网络的无偏蒙特卡罗聚类更新
该研究提出了一种使用物理对称性和变尺度聚类更新以消除偏差且方差较低的方法来进行高维概率分布的无偏抽样,测试了其在经典自旋系统的一阶和二阶相变中的可行性。
- ICLRMARS: 马尔科夫分子采样在多目标药物发现中的应用
本文提出了一种多目标药物分子发现的方法 MARS,它基于分子图的片段进行迭代式编辑,采用马尔科夫链蒙特卡罗采样 (MCMC) 和图神经网络 (GNN) 来寻找高质量的化合物,并在不同维度上进行评估结果表明,该方法在多种多目标设定下表现出卓越 - ICML通过集成神经感知、语法解析和符号推理实现闭环神经符号学习
本文介绍了一种新的用于神经符号计算的学习框架,其中引入了语法模型和反向搜索算法来优化符号推理模块中的误差传播,本文将所提出的学习框架解释为最大似然估计,算法则解释为 Metropolis-Hastings 采样器,实验结果表明,本文方法相对 - ICLR基于能量模型长期动态的随机安全:对抗防御
本论文研究了使用 Markov Chain Monte Carlo 采样和能量模型对预训练分类器进行防御的方法,其目的是从原始输入中删除对抗性信号以进行准确的长期预测,并在 Cifar-10、SVHN 和 Cifar-100 三个数据集上实 - 开放量子系统稳态的变分神经网络假设
本文介绍了一种用神经网络方法确定开放式量子晶格系统稳态的通用变分方法,以纯化的神经网络假设在带有辅助自由度的扩展希尔伯特空间中构建了格子系统的稳态密度矩阵。使用马尔科夫链蒙特卡罗采样可以执行与主方程相关的代价函数的变分最小化。作为第一个应用 - ICML高斯过程潜变量模型的连续采样
本文研究在数据的概率模型中推断一个潜在函数的问题,并探究了基于马尔可夫链蒙特卡罗采样的高效计算方法在大型数据集上的可行性,提出了一种近似方法,使潜在变量和相关参数的顺序采样能够有效地处理增长数据设置,证明了其在无序、非顺序采样下不可行的情况 - 动态随机块模型用于时间演化社交网络
本文提出了一个状态空间模型,将静态网络的随机块模型扩展到动态网络的建模中,并使用扩展卡尔曼滤波器配合局部搜索来拟合模型,实验表明此算法与使用马尔可夫蒙特卡罗抽样的最先进算法相竞争,但计算代价显著降低。