Jun, 2023

从像素学习与专家观察

TL;DR使用专家观察作为强化学习智能体的中间视觉目标,可以帮助解决稀疏奖励问题,从而提高性能并减少专家动作的使用。