Jan, 2025

β-DQN:通过行为演化改善深度Q学习

TL;DR本研究解决了现有探索方法普遍性不足和计算成本高的问题,提出了一种简单高效的探索方法β-DQN,通过行为函数β来增强标准DQN。实验结果表明,β-DQN在多种任务中表现出色,有效提升了深度强化学习中的探索能力。