基于强化学习的变分顺序最优实验设计

Jun, 2023

基于强化学习的变分顺序最优实验设计

Variational Sequential Optimal Experimental Design using Reinforcement Learning

Wanggang Shen, Jiayuan Dong, Xun Huan

TL;DR提出了一种基于贝叶斯框架的变分顺序最优实验设计新方法，采用变分逼近估计期望效用的下界估计来解决最优设计策略，并采取策略梯度方法来优化模型参数和加快收敛速度，旨在优化设计有限序列实验问题，针对参数推断、模型鉴别和面向目标的预测等问题具有实际应用价值。

Abstract

We introduce variational sequential optimal experimental design (vsOED), a new method for optimally designing a finite sequence of experiments under a bayesian framework and with information-gain utilities. Speci

optimal experimental design bayesian framework variational sequential optimal experimental design policy gradient updates sample efficiency

发现论文，激发创造

使用近似动态规划的序贯贝叶斯最优实验设计

本文介绍了用于顺序试验的最优设计策略，并且使用贝叶斯推断的信息理论设计目标针对参数推断进行了 sOED 问题的严谨公式化。同时，研究了具有连续参数，设计和观测空间的非线性设计的数字方法，并利用探索和利用来提高状态空间中经常访问区域的逼近精度。最后，文中展示了对非线性源反演问题的优势。

Apr, 2016

贝叶斯实验设计中基于梯度的随机优化方法

本文从贝叶斯角度研究非线性系统的最优实验设计问题，提出了基于梯度的随机优化方法，并通过传感器放置问题的数值试验证明了该方法的性能。

Dec, 2012

变分贝叶斯最优实验设计

本文介绍了一种基于模型推理的方法来估计 Bayesian 最优实验设计中的信息获取量，并通过多个实验展示了该方法相较于之前的方法具有更快速度和更准确的结果。

Mar, 2019

设计贝叶斯最优实验的统一随机梯度方法

本文提出了一种全概率梯度方法来解决贝叶斯最优实验设计的问题，该方法利用变分下界来进行预期信息增益的优化，并提供多种变分目标，最终表现出比现有方法在高维设计优化中更有效的性能。

Nov, 2019

面向目标的贝叶斯最优非线性模型实验设计中的马尔可夫链蒙特卡洛方法

采用基于贝叶斯方法的计算框架，通过最大化信息增益来确定在非线性观测和预测模型下，最优实验设计以提高感兴趣的预测量的精确度。

Mar, 2024

变分贝叶斯最优实验设计与归一化流

基于贝叶斯优化实验设计的理论，利用变分方法近似求解后验分布，使用正则化流降低 EIG 估计偏差，并通过梯度优化方法对变分参数和设计变量进行同时优化，其结果在两个基准问题和两个实际应用中验证了方法的有效性。

Apr, 2024

用于基于模拟推断的随机梯度贝叶斯最优实验设计

本研究通过互信息边界建立了基于比率的模拟推理和基于随机梯度的变分推理之间的重要联系，将 Bayesian Optimal Experimental Design 方法扩展到 SBI 应用程序中，实现了实验设计和摊销推理函数的同时优化。

Jun, 2023

基于条件正态流的概率贝叶斯最优实验设计

贝叶斯最佳实验设计寻求在预算限制下，通过贝叶斯框架中的实验数据更新系统的先验知识到其后验，具有计算挑战性，我们提出了一种新的联合优化方法，以有效、可伸缩和稳健的方式解决了贝叶斯最佳实验设计问题，在一个具有高维参数和观测值以及选择最有信息的观测的二进制掩模设计的实际磁共振成像数据采集问题中验证了方法的性能。

Feb, 2024

使用深度强化学习进行 X 射线 CT 的序列实验设计

采用深度强化学习方法解决了优化实验设计问题，以选择最具信息量的扫描角度，从而在 CT 中实现少角度成像。

Jul, 2023

POMDP 的深层变分强化学习

本文提出了一种深度变分强化学习方法，该方法引入了归纳偏置，允许代理学习环境的生成模型并在该模型中执行推断以有效地聚合可用信息。通过在 Mountain Hike 和 flickering Atari 的实验中表明，我们的方法优于先前依赖于循环神经网络对过去进行编码的方法。

Jun, 2018