BriefGPT.xyz
May, 2019
任务嵌入与共享策略的元强化学习
Meta Reinforcement Learning with Task Embedding and Shared Policy
HTML
PDF
Lin Lan, Zhenguo Li, Xiaohong Guan, Pinghui Wang
TL;DR
本研究提出了一种meta-RL方法,通过捕捉不同任务之间的共享信息和快速抽象任务特定信息的能力,使用任务编码器生成任务嵌入并在所有任务之间共享策略,实现在训练和新任务上的更好学习能力和更高回报率。
Abstract
Despite significant progress,
deep reinforcement learning
(RL) suffers from
data-inefficiency
and limited
generalization
. Recent efforts a
→