Aug, 2020

使用对抗种群的鲁棒强化学习

TL;DR利用强化学习中的对抗噪音和以聚集对手人口作为训练方法,改善了机器人领域中强化学习中的鲁棒性和泛化性能。