ICMLAug, 2017

安全探索的环境特征解耦学习

TL;DR本文介绍了一种解耦环境特征与任务特定特征的方法,使得代理能够在同一环境下更好的进行任务迁移和新任务风险降低,研究结果表明,此方法能够更安全地利用先前知识。