Feb, 2018

游戏中学习 —— 从零开始解决稀疏奖励任务

TL;DR本文介绍了计划辅助控制 (SAC-X),一种新的强化学习学习范例,它可以在多重稀疏奖励信号存在的情况下从零开始学习复杂的行为,并在具有挑战性的机器人控制环境中得到了实验证明。