Jun, 2018

基于保真度的概率Q学习用于量子系统控制

TL;DR本文介绍了一种基于保真度概率Q学习(FPQL)的方法,用于解决强化学习中探索和利用之间的平衡问题并应用于控制量子系统;该算法采用了保真度来指导学习过程,通过迭代更新每个状态下选择每个动作的概率,实现自然的探索策略而不是基于配置参数的指向性探索,且该算法在学习过程中可以避免局部最优策略从而加速学习过程。