ICMLAug, 2022

多阶段强化学习中关键时期的重要性

TL;DR该研究提出了一种多阶段强化学习策略,以强调在关键时期周围找到合适的刺激以形成奖励,从而提高 AI 代理的性能、效率和稳定性。