Mar, 2022

基于策略的贝叶斯实验设计用于不可微分的隐式模型

TL;DR介绍了一种基于强化学习的最优实验设计方法,通过改进基于策略的贝叶斯最优实验设计方法,将其重构为一个基于马尔可夫决策过程的奖励函数计算模型,使用无损信息下限来学习策略,提供了快速的离线实验设计方案,适用于非可微隐含模型的模拟实验优化设计。