Feb, 2019

探究连续深度强化学习中的泛化能力

TL;DR本文通过深度增强学习模型下的不确定性源和基准测试来研究面临的泛化挑战,并评估了改进泛化性能的几种技术,总结了迄今为止最稳健的技术。