Nov, 2020

PLAS:离线强化学习的潜在动作空间

TL;DR该论文提出了一种使用潜在动作空间学习策略的离线强化学习方法,能够有效克服现有算法存在的内插误差,具有优异的性能表现。