采用参数量子电路迭代地获得变分态,考虑噪音和量子测量结果的随机性,使用与变分态相关的量子费舍尔信息界限定结果精度,并通过实验展示该算法在不同噪声强度下的鲁棒性。
Dec, 2019
本文介绍了基于变分方法的新型混合量子 - 经典算法类别,重点是探究了优化方法和精度水平对变分算法的性能影响,最后提出了用拟牛顿优化方法执行量子逼近优化算法的结果。
Jan, 2017
本文研究在马尔可夫决策过程中的均值 - CVaR 优化问题,并提出了策略梯度和演员评论算法,以在局部风险敏感的最优策略中更新策略参数,解决了一个最优停止问题。
Jun, 2014
基于条件期望的公式,我们提出了一种新的基于采样的 CVaR 梯度估计器,类似于似然比方法。我们分析了估计器的偏差,并证明了相应随机梯度下降算法的收敛性,使 CVaR 优化可以在新的领域应用。例如,我们考虑一个强化学习应用,为 Tetris 游戏学习风险敏感的控制器。
Apr, 2014
本文讨论了量子算法中的优化问题,并提出了一种基于量子 - 经典混合的优化方案,其中包括变分绝热量子算法和单粒子门晶格,通过拟合和消除误差和采用现代没有导数的优化技术来节省计算成本。
Sep, 2015
研究一种基于条件风险价值(CVaR)的风险规避统计学习框架,提出了基于随机梯度下降的算法。对于凸和 Lipschitz 的损失函数,该算法收敛到最优 CVaR,而对于非凸和平滑的损失函数,该算法在 CVaR 上的泛化界表现良好。通过在各种机器学习任务上进行数值实验,证明了该算法有效地将 CVaR 最小化。
Feb, 2020
以 Markov 决策过程为基础,采用面对不确定性的乐观主义原则,使用一种乐观主义的分布 Bellman 算子,将回报分布的概率质量从下尾部移动到上尾部,从而快速学习具有良好 CVaR 的策略。该算法可以在多种模拟环境中更快地找到 CVaR 最优策略。
Nov, 2019
本文提出了一种基于条件风险价值方法的学习选项的方法,旨在处理具有不确定性的模型参数,以实现在平均和最坏情况下都能良好运作的选项,通过实验评估表明该方法在多关节机器人控制任务中获得了较好的表现。
May, 2019
该文主要研究了基于 CVaR 和 chi-squared 分布的鲁棒优化问题,并提出了一种新的算法以及相应的优化方案。研究结果表明,该算法不仅适用于大规模应用,而且在实验中的效率比全样本方法高 9~36 倍。
Oct, 2020
通过对哈密顿变分试探算法的研究,发现它在结构上表现良好,具有较弱或完全不存在的荒漠高原特征和较小的状态空间,因此容易优化。同时也观察到了随着电路层数的增加而出现的从困难局面到优化的转变,以及在 XXZ 模型和横场伊辛模型中实现超参数化的阈值大约按多项式尺度而非指数尺度增长。最后,演示了 HVA 的能力和有效性,将其用于求解具有长程相互作用和幂律纠缠缩放的 Haldane-Shastry 哈密顿量的基态近似。
Aug, 2020