Jun, 2022

IGN:隐式生成网络

TL;DR利用 GAN 模型的生成器和判别器函数与分位数回归来近似状态行动返回分布的完整分位数值,结合最近的分布强化学习的进展,实现了基于 IQN 的最新分布式变体模型,并在 ALE 中基于 57 种 Atari 2600 游戏的基准数据集上演示了改进的性能,进而使用策略优化和评估的方式展示了对风险敏感策略的最新训练表现。