ICMLJul, 2020

因果模型的可迁移性结构映射

TL;DR本文介绍了一种基于对象导向表现形式的迁移学习框架,该框架利用人类学习因果模型并将其用于环境的变量之间的迁移。作者将连续优化的结构学习技术应用于对象之间的因果关系的显式学习中,并通过基于因果知识的对象分类将其迁移到目标领域。最后,在强化学习中,作者结合了因果模型和无模型方法,实现对格子世界环境中的对象表现的优化。