Mar, 2022

用噪声替换先验提高自举DQN的多样性

TL;DR通过从高斯分布中采样引入噪音,本研究探讨了用噪声替换先验知识来增加 Bootstrapped Deep Q-Learning 中多样性的可能性,并在 Atari 基准上实验,将该算法与原始算法及其他相关算法进行了比较,结果表明该修改方案显著提高了模型的评估分数,保证了多样性的完整性。