Mar, 2022

物理机器人实时控制的异步强化学习

TL;DR本文论述了异步学习和顺序学习的比较,并在真实环境下使用机器人手臂和视觉任务进行了实验。研究结果表明,当学习更新的时间成本增加时,顺序学习的性能会显著下降,而异步学习会明显胜过顺序学习。