Feb, 2022

利用抑制网络的软 AC 框架加速重训练

TL;DR本文提出了一种受神经科学研究启发的新方法,使用抑制性网络,以允许分离和自适应状态值评估,以及不同的自动熵调整,最终我们的方法允许控制抑制来处理利用较少风险获取的行为和探索新行为之间的冲突,以克服更具挑战性的任务,并通过在 OpenAI Gym 环境中进行实验验证。