ICMLMay, 2022

深度强化学习中的优先偏差

TL;DR本文研究了深度强化学习算法中的优先性偏差问题,提出了一种简单且通用的机制来解决这个问题,并将其应用于离散和连续动作领域的算法中,从而显著提高了它们的性能。