IJCAIMay, 2019
任务嵌入与共享策略的元强化学习
Meta Reinforcement Learning with Task Embedding and Shared Policy
Lin Lan, Zhenguo Li, Xiaohong Guan, Pinghui Wang
TL;DR本研究提出了一种 meta-RL 方法,通过捕捉不同任务之间的共享信息和快速抽象任务特定信息的能力,使用任务编码器生成任务嵌入并在所有任务之间共享策略,实现在训练和新任务上的更好学习能力和更高回报率。