BriefGPT.xyz
Sep, 2018
抽象表征下的联合强化学习
Combined Reinforcement Learning via Abstract Representations
HTML
PDF
Vincent François-Lavet, Yoshua Bengio, Doina Precup, Joelle Pineau
TL;DR
本文提出一种新的方法,通过共享基于低维学习的环境编码来明确地连接无模型和有模型的强化学习方法,该方法能够捕捉到总结性抽象,同时具有模块化的特点,因此具有良好的泛化能力和计算效率,并在较小的潜在状态空间中进行计划。此外,此方法还能恢复足够低维的环境表示,从而为可解释的人工智能、探索和迁移学习开辟了新的策略。
Abstract
In the quest for efficient and robust
reinforcement learning
methods, both
model-free
and
model-based
approaches offer advantages. In this
→