量子策略梯度训练问题

Jun, 2024

Trainability issues in quantum policy gradients

André Sequeira, Luis Paulo Santos, Luis Soares Barbosa

TL;DR研究了参数化量子电路为基础的强化学习策略的可训练性，发现拥有指数小梯度和梯度爆炸的标准荒原问题，以及这些现象与基态分区和分区映射相关，采用连续型分区的基态可以确保多项式数量的训练窗口和测量次数，该研究在多臂赌博机环境中进行了实证验证。

Abstract

This research explores the trainability of Parameterized Quantum circuit-based policies in reinforcement learning, an area that has recently seen a surge in empirical exploration. While some studies suggest improved sam

parameterized quantum circuit reinforcement learning sample complexity barren plateaus basis-state partitioning

发现论文，激发创造

量子神经网络训练景观中的贫瘠高原

本文研究了嘈杂中等规模量子设备的参数化量子电路的梯度估计和优化问题。作者指出，由于希尔伯特空间的指数维度和梯度估计复杂度，随机电路不适用于超过少量量子比特的混合量子 - 经典算法。

Mar, 2018

量子自然政策梯度：朝着样本有效的强化学习

使用变分量子电路作为函数逼近器，提出了量子自然策略梯度（Quantum Natural Policy Gradient，QNPG）算法。在 Contextual Bandits 环境中进行实验，证明 QNPG 相对于基于一阶的训练具有更快的收敛速度和稳定性，从而减少了样本复杂度，并在 12 量子比特硬件设备上进行了训练。

Apr, 2023

超越贫瘠高原：量子变分算法被陷阱所淹没

通过研究局部极小值和 Barren 高原现象，证明在全局最小能量附近未知最优参数的情况下，一类浅而无 barren 高原的变分量子模型具有很少的局部极小值，以至于在没有好的初值参数的情况下无法进行训练。此外，通过统计查询框架研究变分量子算法的可训练性，并表明大多数量子模型的噪声优化都需要指数级的查询数，虽然有希望通过研究某些类别的变分算法来解决这个问题。

May, 2022

深度量子神经网络中梯度测量效率与表达能力的权衡

量子神经网络（QNNs）需要一种高效的训练算法以实现实际的量子优势。我们提出了一种通用的权衡关系，即高测量效率会导致较低的表达能力，而减少 QNN 的表达能力可以提高梯度测量效率，同时提出了一种称为稳定 - 逻辑乘积 ansatz 的 QNN 设计方案，可以实现权衡不等式的上限，在学习未知对称函数时显著减少了量子资源需求，保持了准确性和可训练性。

Jun, 2024

在量子硬件上计算解析梯度

本文介绍了一种利用同一或几乎相同的架构的方法来估计量子测量期望值的梯度，以优化杂化量子 - 经典算法的目标函数，尤其适用于量子化学、药物发现和机器学习等领域。

Nov, 2018

通过正则化策略提高变分量子电路的可训练性

在嘈杂中等规模量子（NISQ）时代，本研究提出一种使用先验知识和高斯噪声扩散来规范化模型参数的策略，以提高量子变分电路的可训练性并解决梯度问题。实验证明这种方法对超越经典模型的四个公共数据集的可训练性具有改进作用。

May, 2024

浅层参数量子电路中与成本函数有关的不毛之地

本文研究了量子电路参数优化问题，通过对全局和局部可观测量定义了两种方法，证明了在一定条件下采用局部可观测量定义的方法能够获得更好的训练效果。

Jan, 2020

宽量子神经网络动力学分析理论

研究了一类可变量量子机器学习模型的梯度下降动力学特性，预测和表征了残余训练误差随系统参数的指数衰减规律，并通过数值实验验证了结果。

Mar, 2022

量子生成模型中的可训练性障碍与机遇

本文研究了量子生成模型中如何解决靠近平原以及指数损失集中的挑战，提出了解决这个问题的新方法 Quantum fidelity-type loss，并且通过对高能物理数据建模表明了本研究理论结果的正确性。

May, 2023

解决参数化量子电路中贫瘠高原问题的初始化策略

文章提出了一种随机参数初始化生成浅层块的量子电路初始化策略，以应对梯度消失问题，实现了基于梯度的训练方法，解决了过去针对基本问题不能使用最紧凑的量子电路的问题。

Mar, 2019