May, 2023

RAMario: 蛇形算法的实验方法 -- 马里奥的强化学习

TL;DR本论文探讨了使用 Reptile 算法的实验方法进行增强学习,训练神经网络玩超级马里奥兄弟游戏。结果表明,该算法提供了一种前景可观的机器学习方法,具有与其他两个算法相当甚至更好的性能,特别是在移动代理进行了 100 万次训练时,这算法在游戏中的表现明显优于 PPO 和 DQN 算法。