Mar, 2021
领域鲁棒性视觉仿真学习与互信息约束
Domain-Robust Visual Imitation Learning with Mutual Information
Constraints
TL;DR介绍了一种名为Disentangling Generative Adversarial Imitation Learning(DisentanGAIL)的新算法,可通过对抗学习来自动学习高维度任务表现观察的特征,从而成功进行模仿,同时忽略专家和代理之间的差异,此算法在包括平衡、操纵和运动任务在内的各种控制问题中都具有高效性和稳健性。