Mar, 2024

高效零点V2:以有限数据掌握离散与连续控制

TL;DR该论文介绍了EfficientZero V2,它是一个用于高效样本学习的强化学习算法的通用框架,在多个领域中扩展了其性能,包括连续和离散动作以及视觉和低维度输入,在有限数据的情况下,EfficientZero V2在各种任务中明显优于现有技术,特别是在Atari 100k、Proprio Control和Vision Control等基准测试中表现出更好的结果。