ICMLMay, 2018

强化学习中的样本重要性加权转移

TL;DR本篇论文提出了一种基于模型的技术,在传输体验样本时自动估算每个样本与给定目标任务的关联性,以及在 RL 问题中使用重要性权重来解决负迁移问题,模型的结果经实验证明比目前最新的方法具有更好的学习性能和抗差能力。