ICMLJun, 2019

通过对策略分布进行建模的迁移学习

TL;DR探究并适应新任务在传递学习设置中是强化学习中的一个核心挑战。针对该问题,我们利用在贝叶斯深度强化学习模式下模拟策略分布的想法提出了一种传输策略。我们通过在完全可见的 GridWorld 和部分可见的 MiniGrid 环境中展示有利的实验结果来支持我们的假设。