MMApr, 2023

为量子控制设计的样本高效的基于模型的强化学习

TL;DR利用基于神经常微分方程(ODE)的归纳偏置,提出了一种基于模型的强化学习(RL)方法,用于在噪声时变门优化中近似环境模型,其时间依赖部分包括控制方式完全已知。与标准的基于模型的 RL 相比,我们的方法在样本复杂度方面具有数量级的优势,适用于控制一、二量子位系统。