Jun, 2023

基于强化学习的变分顺序最优实验设计

TL;DR提出了一种基于贝叶斯框架的变分顺序最优实验设计新方法,采用变分逼近估计期望效用的下界估计来解决最优设计策略,并采取策略梯度方法来优化模型参数和加快收敛速度,旨在优化设计有限序列实验问题,针对参数推断、模型鉴别和面向目标的预测等问题具有实际应用价值。