Apr, 2023

分布式优先经验回放的量子深度 Q 学习

TL;DR本文介绍了 QDQN-DPER 框架,以提高量子强化学习(QRL)在解决顺序决策任务中的效率。框架将优先经验回放和异步训练结合到训练算法中,以减少高采样复杂度。数值模拟表明,QDQN-DPER 比具有相同模型架构的基线分布式量子 Q 学习表现更好。该提议的框架在保持训练效率的同时具有更复杂的任务潜力。