ABC 强化学习

ICMLMar, 2013

ABC Reinforcement Learning

Christos Dimitrakakis, Nikolaos Tziortziotis

TL;DR该论文介绍了一个基于 ABC 的简单通用框架，用于无似然贝叶斯强化学习，该算法主要利用先验分布，能够应用在基于详细模拟模型的领域，试验结果证实了该算法在 LSPI 比较中具有潜在优势，并引入了一个定理，证明了该算法是原则上可行的。

Abstract

This paper introduces a simple, general framework for likelihood-free bayesian reinforcement learning, through approximate bayesian computation

likelihood-free bayesian reinforcement learning approximate bayesian computation generative models rollout algorithms

发现论文，激发创造

近似贝叶斯计算中的似然函数逼近

本章节在《近似贝叶斯计算手册》中发表，概述了两种估计不可计算似然性的方法，即基于模型根据统计量估计出的参数假设的贝叶斯人工似然法和使用一组约束来构建经验似然，或者使用近似方法来规避对模型的模拟。这两种方法的具体实施被展现在各种不同复杂度的模型中。

Mar, 2018

Hamiltonian ABC

介绍了一种基于 Hamiltonian Monte Carlo（HMC）和随机梯度的近似贝叶斯计算框架，称为 Hamiltonian ABC（HABC）。该方法使用前向模拟来近似贝叶斯计算的梯度，并展示了在机器学习领域进行高维问题的 HABC 样本比使用真实梯度的传统贝叶斯推断方法的结果相当。

Mar, 2015

一类时间序列模型的近似贝叶斯计算

本文介绍了一类基于 ABC 思路的近似方法，着重于处理那些观测和参数似然不易求得的时间序列模型，并保持了原始统计模型的概率结构，为参数推断提供了一种分析近似偏差和适应计算方法的新途径。

Jan, 2014

基于模型的近似贝叶斯计算的高效采样规则

本文提出了一种基于贝叶斯优化 (Bayesian optimization) 和高斯过程 (Gaussian processes) 的 ABC (Approximate Bayesian computation) 后验分布估计方法，通过计算 ABC 后验密度的不确定性来定义损失函数，并选择下一个评估位置以最小化期望损失。实验表明，该方法通常比常见的 BO 策略产生更准确的近似。

Apr, 2017

基于回归密度估计的近似贝叶斯计算

本文探讨了基于回归密度估计技术的方法来近似似然函数，该方法可促进贝叶斯推断及频率学推断。该方法在推断特殊极端值问题中进行了实证研究，实现了贝叶斯推断和频率学推断。

Dec, 2012

使用仿真器网络进行无似然推断

使用基于概率神经模拟器网络的近似贝叶斯计算方法，通过学习模拟数据的合成似然函数，自适应选择模拟操作，并利用获取函数对不确定性进行建模，无需事先定义拒绝阈值或距离函数，实现模拟容易应用于高维问题的准确高效的推断。

May, 2018

近似贝叶斯计算方法

这篇综述论文研究了近年来对原始 ABC 算法进行的各种改进和扩展，探讨了 ABC 方法在缺少可追踪度的似然问题中的解决方案，并且指出了它们存在的校准困难和不稳定性问题。

Jan, 2011

DR-ABC: 基于核分布回归的近似贝叶斯计算

本研究提供了一种新的基于核回归的框架方法，使用随机傅里叶特征来实现大规模核学习，以选择合适的问题特定摘要统计量来近似真实条件概率分布，该方法在近似贝叶斯计算中有杰出表现。

Feb, 2016

带有领域专家的近似贝叶斯计算

本文介绍了一种面向主动学习的 ABC 统计量选择方法，可减少领域专家的工作量，并在预算有限的情况下获得更好的后验估计。

Jan, 2022

贝叶斯强化学习：一项调查

本文深入探讨贝叶斯方法在强化学习中的作用，讨论了使用贝叶斯推理进行动作选择和利用先验知识等方面的优点，概述了在单步赌博机模型、模型基 RL 和模型无 RL 中贝叶斯方法的模型与方法，并全面评估了贝叶斯 RL 算法及其理论和实证性质。

Sep, 2016