为量子控制设计的样本高效的基于模型的强化学习

MMApr, 2023

为量子控制设计的样本高效的基于模型的强化学习

Sample-efficient Model-based Reinforcement Learning for Quantum Control

Irtaza Khalid, Carrie A. Weidner, Edmond A. Jonckheere, Sophie G. Shermer, Frank C. Langbein

TL;DR利用基于神经常微分方程（ODE）的归纳偏置，提出了一种基于模型的强化学习（RL）方法，用于在噪声时变门优化中近似环境模型，其时间依赖部分包括控制方式完全已知。与标准的基于模型的 RL 相比，我们的方法在样本复杂度方面具有数量级的优势，适用于控制一、二量子位系统。

Abstract

We propose a model-based reinforcement learning (RL) approach for noisy time-dependent gate optimization with improved sample complexity over model-free RL. →

model-based reinforcement learning noisy time-dependent gate optimization inductive bias hamiltonian learning sample complexity

发现论文，激发创造

通过深度强化学习实现通用量子控制

提出一种新的量子控制框架，通过在强化学习智能体的训练环境中加入控制噪声，利用强化学习技术优化量子计算的速度和保真度以及对泄漏和随机控制误差的抗扰性，最终取得了一定的优化成果。

Mar, 2018

量子门控制的深度强化学习

本研究构建了一个深度强化学习的神经网络（DDDQN）来控制可控参数的时间依赖性，以高效、精确地实现两种典型的量子门：单量子比特哈达玛门和双量子比特 CNOT 门，从而实现了高效、精确的量子门控制，为更多的深度强化学习技术在量子控制问题中的研究铺平了道路。

Feb, 2019

学习鲁棒和高精度的量子控制

本文展示了可以将时间有序的量子演化视作层次有序的神经网络，并将鲁棒控制看作是训练高度泛化的神经网络，利用批处理优化技巧使优化的结果能够显着提高控制的鲁棒性和保持高保真度。

Nov, 2018

强化学习辅助的量子优化

我们提出了一个基于强化学习的算法，用于量子近似优化算法（QAOA）内的量子反馈控制，能够基于局部信息选择控制参数，并实现了训练数据的小样本转移学习。

Apr, 2020

量子控制不同阶段的强化学习

本文采用最新的强化学习技术，通过优化找到非可积多体量子系统中从初始状态到目标状态的短高保真度驱动协议，同时在协议时长的空间中呈现类自旋玻璃相变，并揭示了基于强化学习的 RL 方法在非平衡量子物理应用中的潜在用途。

May, 2017

超导量子计算机上基于实验深度强化学习的错误鲁棒门集设计

使用深度强化学习方法，在超导量子计算机上设计出一组通用的、能够容错的逻辑门，无需了解系统的特定哈密顿模型、控制或基础误差过程并表现出卓越的性能，与其他黑盒优化技术相比具有可比性或略微更优的性能。

May, 2021

基于数据驱动的实时高效强化学习算法的 H∞控制：应用于自动化移动出行系统

基于 Q 学习的算法解决线性离散时间系统的 H∞控制，并实现了模型无关的参数在线学习，从而将计算复杂性降低到 qu 的平方，其中 q 是状态变量、控制输入和干扰大小之和。

Sep, 2023

面向参数变化系统的模型自适应强化学习控制中的样本高效迁移

本文利用模型控制的思想解决了强化学习算法的样本效率问题，并通过四个基准实例验证了其性能。

May, 2023

一种基于增强式强化学习的量子系统控制方法

提出了一种基于增强强化学习（QSC-ERL）的量子系统控制方法，使用增强神经网络将强化学习中的状态和动作映射到量子系统中的量子状态和控制操作，在有限资源的条件下能够实现接近 1 的保真度的量子系统学习控制，并且在量子状态演化中所需的周期较少。

Sep, 2023

基于概率模型预测控制的高效数据强化学习

本文提出了基于概率模型预测控制（MPC）的基于模型的 RL 框架，以减少与环境的相互作用次数的方法。该方法使用高斯过程学习概率转换模型来减少模型误差的影响，同时使用 MPC 找到最小化预期长期成本的控制序列，以达到在受限环境下使用 RL 的目的。

Jun, 2017