Nov, 2023

基于最优模拟的贝叶斯决策

TL;DR通过学习预期效用(或其分布)作为动作和数据空间的函数的代理模型,我们提出了一个高效计算在难以计算的似然函数下的最优贝叶斯决策的框架。我们利用基于模拟的推断和贝叶斯优化的最新进展,开发了主动学习方案来选择参数和动作空间中要模拟的位置,从而尽可能少地进行模拟来学习最优动作。该框架非常高效,通常需要的模型调用次数比相关的后验推断任务少,并且比基于蒙特卡洛方法的方法高出 100-1000 倍。我们的框架为进行贝叶斯决策提供了新的能力,特别是在似然函数难以处理且模拟昂贵的挑战性领域。