Dec, 2019

深度选项学习中权重共享的作用

TL;DR本篇论文提出了一种针对option-critic架构中参数独立性的扩展,可以显著提高使用长期选项训练游戏的稳定性和效率。