Feb, 2022

VRL3: 基于数据驱动的视觉深度强化学习框架

TL;DR提出了 VRL3 这一数据驱动框架,在视觉深度强化学习中取得了极高的效率,并且在手部操作任务中的样本效率比先前最先进的方法高出了 780%。VRL3 在最困难的任务中样本效率提高了 1220%(使用更宽的编码器达到 2440%)并且只需 10%的计算量就能解决该任务,这些结果清楚地证明了数据驱动深度强化学习的巨大潜力。