Oct, 2021

通过世界模型发现和实现目标

TL;DR介绍了一种基于无监督学习的方法 ——Latent Explorer Achiever(LEXA),该方法通过学习世界模型,训练探索者和实现者策略来解决复杂视觉环境中人工智能代理如何学会解决多种不同任务的问题,该方法在四个标准机器人操作和运动领域上显著优于先前的无监督目标达成方法,并最终证明了其可扩展性和普适性。